A near-data select scan operator for database systems
| Autor(a) principal: | |
|---|---|
| Data de Publicação: | 2017 |
| Tipo de documento: | Dissertação |
| Idioma: | eng |
| Título da fonte: | Repositório Institucional da UFPR |
| Texto Completo: | https://hdl.handle.net/1884/53293 |
Resumo: | Orientador: Eduardo Cunha de Almeida |
| id |
UFPR_773c03eedeeac2f7f084e99dd4fe9ccd |
|---|---|
| oai_identifier_str |
oai:acervodigital.ufpr.br:1884/53293 |
| network_acronym_str |
UFPR |
| network_name_str |
Repositório Institucional da UFPR |
| repository_id_str |
308 |
| spelling |
Alves, Marco Antonio Zanata, 1984-Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em InformáticaAlmeida, Eduardo Cunha de, 1977-Tomé, Diego Gomes2024-11-01T20:22:45Z2024-11-01T20:22:45Z2017https://hdl.handle.net/1884/53293Orientador: Eduardo Cunha de AlmeidaCoorientador: Marco Antonio Zanata AlvesDissertação (mestrado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa: Curitiba, 21/12/2017Inclui referências : p. 61-64Resumo: Um dos grandes gargalos em sistemas de bancos de dados focados em leitura consiste em mover dados em torno da hierarquia de memória para serem processados na CPU. O movimento de dados é penalizado pela diferença de desempenho entre o processador e a memória, que é um problema bem conhecido chamado memory wall. O surgimento de memórias inteligentes, como o novo Hybrid Memory Cube (HMC), permitem mitigar o problema do memory wall executando instruções em chips de lógica integrados a uma pilha de DRAMs. Essas memórias possuem potencial para computação de operações de banco de dados direto em memória além do armazenamento de bancos de dados. O objetivo desta dissertação é justamente a execução do operador algébrico de seleção direto em memória para reduzir o movimento de dados através da memória e da hierarquia de cache. O foco na operação de seleção leva em conta o fato que a leitura de colunas a serem filtradas movem grandes quantidades de dados antes de outras operações como junções (ou seja, otimização push-down). Inicialmente, foi avaliada a execução da operação de seleção usando o HMC como uma DRAM comum. Posteriormente, são apresentadas extensões à arquitetura e ao conjunto de instruções do HMC, chamado HMC-Scan, para executar a operação de seleção próximo aos dados no chip lógico do HMC. Em particular, a extensão HMC-Scan tem o objetivo de resolver internamente as dependências de instruções. Contudo, nós observamos que o HMC-Scan requer muita interação entre a CPU e a memória para avaliar a execução de filtros de consultas. Portanto, numa segunda contribuição, apresentamos a extensão arquitetural HIPE-Scan para diminuir esta interação através da técnica de predicação. A predicação suporta a avaliação de predicados direto em memória sem necessidade de decisões da CPU e transforma dependências de controle em dependências de dados (isto é, execução predicada). Nós implementamos a operação de seleção próximo aos dados nas estratégias de execução de consulta orientada a linha/coluna/vetor para a arquitetura x86 e para nas duas extensões HMC-Scan e HIPE-Scan. Nossas simulações mostram uma melhora de desempenho de até 3.7× para HMC-Scan e 5.6× para HIPE-Scan quando executada a consulta 06 do benchmark TPC-H de 1 GB na estratégia de execução orientada a coluna.Abstract: A large burden of processing read-mostly databases consists of moving data around the memory hierarchy rather than processing data in the processor. The data movement is penalized by the performance gap between the processor and the memory, which is the well-known problem called memory wall. The emergence of smart memories, as the new Hybrid Memory Cube (HMC), allows mitigating the memory wall problem by executing instructions in logic chips integrated to a stack of DRAMs. These memories can enable not only in-memory databases but also have potential for in-memory computation of database operations. In this dissertation, we focus on the discussion of near-data query processing to reduce data movement through the memory and cache hierarchy. We focus on the select scan database operator, because the scanning of columns moves large amounts of data prior to other operations like joins (i.e., push-down optimization). Initially, we evaluate the execution of the select scan using the HMC as an ordinary DRAM. Then, we introduce extensions to the HMC Instruction Set Architecture (ISA) to execute our near-data select scan operator inside the HMC, called HMC-Scan. In particular, we extend the HMC ISA with HMC-Scan to internally solve instruction dependencies. To support branch-less evaluation of the select scan and transform control-flow dependencies into data-flow dependencies (i.e., predicated execution) we propose another HMC ISA extension called HIPE-Scan. The HIPE-Scan leads to less iteration between processor and HMC during the execution of query filters that depends on in-memory data. We implemented the near-data select scan in the row/column/vector-wise query engines for x86 and two HMC extensions, HMC-Scan and HIPE-Scan achieving performance improvements of up to 3.7× for HMC-Scan and 5.6× for HIPE-Scan when executing the Query-6 from 1 GB TPC-H database on column-wise.64 p. : il.application/pdfDisponível em formato digitalCiência da computaçãoArquitetura de computadorBanco de dadosSistemas de memoria de computadoresA near-data select scan operator for database systemsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisengreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - D - DIEGO GOMES TOME.pdfapplication/pdf1502032https://acervodigital.ufpr.br/bitstream/1884/53293/1/R%20-%20D%20-%20DIEGO%20GOMES%20TOME.pdf5e34f8dcc54d9babadb05802a9024af3MD51open access1884/532932024-11-01 17:22:45.155open accessoai:acervodigital.ufpr.br:1884/53293Repositório InstitucionalPUBhttp://acervodigital.ufpr.br/oai/requestinformacaodigital@ufpr.bropendoar:3082024-11-01T20:22:45Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false |
| dc.title.pt_BR.fl_str_mv |
A near-data select scan operator for database systems |
| title |
A near-data select scan operator for database systems |
| spellingShingle |
A near-data select scan operator for database systems Tomé, Diego Gomes Ciência da computação Arquitetura de computador Banco de dados Sistemas de memoria de computadores |
| title_short |
A near-data select scan operator for database systems |
| title_full |
A near-data select scan operator for database systems |
| title_fullStr |
A near-data select scan operator for database systems |
| title_full_unstemmed |
A near-data select scan operator for database systems |
| title_sort |
A near-data select scan operator for database systems |
| author |
Tomé, Diego Gomes |
| author_facet |
Tomé, Diego Gomes |
| author_role |
author |
| dc.contributor.other.pt_BR.fl_str_mv |
Alves, Marco Antonio Zanata, 1984- Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática |
| dc.contributor.advisor1.fl_str_mv |
Almeida, Eduardo Cunha de, 1977- |
| dc.contributor.author.fl_str_mv |
Tomé, Diego Gomes |
| contributor_str_mv |
Almeida, Eduardo Cunha de, 1977- |
| dc.subject.por.fl_str_mv |
Ciência da computação Arquitetura de computador Banco de dados Sistemas de memoria de computadores |
| topic |
Ciência da computação Arquitetura de computador Banco de dados Sistemas de memoria de computadores |
| description |
Orientador: Eduardo Cunha de Almeida |
| publishDate |
2017 |
| dc.date.issued.fl_str_mv |
2017 |
| dc.date.accessioned.fl_str_mv |
2024-11-01T20:22:45Z |
| dc.date.available.fl_str_mv |
2024-11-01T20:22:45Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1884/53293 |
| url |
https://hdl.handle.net/1884/53293 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.relation.pt_BR.fl_str_mv |
Disponível em formato digital |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
64 p. : il. application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPR instname:Universidade Federal do Paraná (UFPR) instacron:UFPR |
| instname_str |
Universidade Federal do Paraná (UFPR) |
| instacron_str |
UFPR |
| institution |
UFPR |
| reponame_str |
Repositório Institucional da UFPR |
| collection |
Repositório Institucional da UFPR |
| bitstream.url.fl_str_mv |
https://acervodigital.ufpr.br/bitstream/1884/53293/1/R%20-%20D%20-%20DIEGO%20GOMES%20TOME.pdf |
| bitstream.checksum.fl_str_mv |
5e34f8dcc54d9babadb05802a9024af3 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR) |
| repository.mail.fl_str_mv |
informacaodigital@ufpr.br |
| _version_ |
1847525442199748608 |