Detalhes bibliográficos
Ano de defesa: |
2015 |
Autor(a) principal: |
Pinto, Clícia dos Santos |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Boratto, Murilo do Carmo,
Santos, Carlos Antonio de Souza Teles,
Durão, Frederico Araujo |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Instituto de Matemática. Departamento de Ciência da Computação
|
Programa de Pós-Graduação: |
Mestrado Multiinstitucional em Ciência da Computação
|
Departamento: |
Não Informado pela instituição
|
País: |
Brasil
|
Palavras-chave em Português: |
|
Área do conhecimento CNPq: |
|
Link de acesso: |
http://repositorio.ufba.br/ri/handle/ri/19307
|
Resumo: |
Transformar os dados armazenados em informações úteis tem sido um desafio cada vez maior e mais complexo a medida em que o volume de dados produzidos todos os dias aumenta. Nos últimos anos, conceitos e tecnologias de Big Data têm sido amplamente utilizados como solução para o gerenciamento de grandes quantidades de dados em diferentes domínios. A proposta deste trabalho diz respeito `a utiliza¸c˜ao de técnicas de ETL (extração,transformação e carga) no desenvolvimento de um módulo de pré-processamento para o pareamento probabilístico de registros em bases de dados na área de Saúde Pública. A utiliza¸c˜ao da ferramenta de processamento distribuído do Spark garante o tratamento adequado para o contexto de Big Data em que esta pesquisa está inserida, gerando respostas em tempo hábil. |