Aplicação de ETL para a integração de dados com ênfase em big data na área de saúde pública

Detalhes bibliográficos
Ano de defesa: 2015
Autor(a) principal: Pinto, Clícia dos Santos
Orientador(a): Não Informado pela instituição
Banca de defesa: Boratto, Murilo do Carmo, Santos, Carlos Antonio de Souza Teles, Durão, Frederico Araujo
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Instituto de Matemática. Departamento de Ciência da Computação
Programa de Pós-Graduação: Mestrado Multiinstitucional em Ciência da Computação
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
ETL
Área do conhecimento CNPq:
Link de acesso: http://repositorio.ufba.br/ri/handle/ri/19307
Resumo: Transformar os dados armazenados em informações úteis tem sido um desafio cada vez maior e mais complexo a medida em que o volume de dados produzidos todos os dias aumenta. Nos últimos anos, conceitos e tecnologias de Big Data têm sido amplamente utilizados como solução para o gerenciamento de grandes quantidades de dados em diferentes domínios. A proposta deste trabalho diz respeito `a utiliza¸c˜ao de técnicas de ETL (extração,transformação e carga) no desenvolvimento de um módulo de pré-processamento para o pareamento probabilístico de registros em bases de dados na área de Saúde Pública. A utiliza¸c˜ao da ferramenta de processamento distribuído do Spark garante o tratamento adequado para o contexto de Big Data em que esta pesquisa está inserida, gerando respostas em tempo hábil.