Implementação eficiente de subconjunto do BLAS para o bluegene/L.

Detalhes bibliográficos
Ano de defesa: 2004
Autor(a) principal: Bachega, Leonardo Ruggiero
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-17102024-153435/
Resumo: O BlueGene/L é um supercomputador desenvolvido pela IBM que visa a execução de aplicações numéricas de alto desempenho tais como simulações de fenômenos físicos e bioquímicos. Esta máquina deverá fornecer 360TFlops de desempenho máximo distribuído entre 65.536 nós de computação. De modo a atingir alta porcentagem do desempenho máximo desta máquina, o software executado deve ser otimizado para fazer uso eficiente das características de hardware disponíveis. Este trabalho tem como foco a otimização de um subconjunto do BLAS que será executado em cada nó de computação do BlueGene/L. O BLAS (Basic Linear Algebra Subprograms) é considerado padrão de facto para rotinas que implementam operações elementares de álgebra linear, sendo as rotinas deste pacote utilizadas como blocos construtores de aplicações científicas e de outras bibliotecas de software numérico. Uma versão otimizada das rotinas do BLAS para o BlueGene/L deve levar a um alto desempenho na execução de aplicações que as utilizam.