Framework de big data
| Main Author: | |
|---|---|
| Publication Date: | 2020 |
| Other Authors: | , |
| Format: | Other |
| Language: | por |
| Source: | Biblioteca Digital de Teses e Dissertações da Faculdade São Leopoldo Mandic |
| Download full: | https://biblioteca.slmandic.edu.br/biblioteca/acervo/detalhe/197193 |
Summary: | As características inerentes ao big data exigem frameworks específicos para que os dados sejam transformados em valor. Velocidade. volume e variedade representam os aspectos de big data mais reconhecidos. Quanto à velocidade. os dados são produzidos de forma constante. e são necessárias aplicações específicas para lidar com o alto fluxo (data streaming). Aplicações da Apache. como Spark Streaming. Flink e Storm são exemplos de sistemas desenvolvidos para auxiliar no tratamento de dados em tempo real. O volume. representado pela imensa quantidade de dados gerados. exige sistemas de arquivos distribuídos. como HDFS (Hadoop). Esses sistemas auxiliam na redução de custos e aumentam a escalabilidade. pois permitem a criação de clusters de computadores com hardware de baixo custo. Em um cluster Hadoop. os dados são replicados de acordo com uma escala muitas vezes igual a 3 (isso significa que cada pedaço de dados estará armazenado em três nós diferentes de um cluster). Se um nó falhar. ainda teremos os mesmos dados em outros dois. e o sistema irá se reajustar para que uma terceira réplica seja criada novamente. Ou seja: hardware de baixo custo tende a falhar. mas um sistema de arquivos distribuído específico para big data resolve o problema. mantendo réplicas para os dados. Ambientes de big data armazenam dados variados. como dados estruturados. semiestruturados e não estruturados. Nos últimos anos. surgiram os bancos de dados NoSQL (Not Only SQL). que facilitam a manipulação de dados estruturados e semiestruturados. O banco MongoDB. por exemplo. armazena dados em formato de documentos; o Neo4j trabalha com grafos; e o Apache Cassandra armazena dados em formato de colunas. Para dados não estruturados. o HDFS ainda é a opção mais utilizada. Outros "Vs" também são reconhecidos por caracterizar big data. como visibilidade. variabilidade. vulnerabilidade. veracidade. vagueza e visualização — a qual é de grande importância para estudantes da área. Big data envolve dados que não entendemos ou cuja extração de insight é impossível sem apoio de ferramentas e técnicas de visualização. Neste contexto. é essencial saber trabalhar com linguagens de programação como R e Python. além de sistemas como Tableau. que permite o desenvolvimento simplificado de visualizações de dados. Este livro abordará tais conteúdos. introduzindo os principais frameworks para armazenamento. processamento e visualização de dados em big data. Existem centenas de possibilidades de combinações para a criação de um ambiente de big data. e. nesta obra. você estudará sobre os frameworks mais utilizados |
| id |
SLMC-1_e11ff0810a7ffcb0f7de1b86de27a822 |
|---|---|
| oai_identifier_str |
oai:prima.com.br:197193 |
| network_acronym_str |
SLMC-1 |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da Faculdade São Leopoldo Mandic |
| repository_id_str |
|
| spelling |
Framework de big data0Ciências da computaçãoMB ExatasAs características inerentes ao big data exigem frameworks específicos para que os dados sejam transformados em valor. Velocidade. volume e variedade representam os aspectos de big data mais reconhecidos. Quanto à velocidade. os dados são produzidos de forma constante. e são necessárias aplicações específicas para lidar com o alto fluxo (data streaming). Aplicações da Apache. como Spark Streaming. Flink e Storm são exemplos de sistemas desenvolvidos para auxiliar no tratamento de dados em tempo real. O volume. representado pela imensa quantidade de dados gerados. exige sistemas de arquivos distribuídos. como HDFS (Hadoop). Esses sistemas auxiliam na redução de custos e aumentam a escalabilidade. pois permitem a criação de clusters de computadores com hardware de baixo custo. Em um cluster Hadoop. os dados são replicados de acordo com uma escala muitas vezes igual a 3 (isso significa que cada pedaço de dados estará armazenado em três nós diferentes de um cluster). Se um nó falhar. ainda teremos os mesmos dados em outros dois. e o sistema irá se reajustar para que uma terceira réplica seja criada novamente. Ou seja: hardware de baixo custo tende a falhar. mas um sistema de arquivos distribuído específico para big data resolve o problema. mantendo réplicas para os dados. Ambientes de big data armazenam dados variados. como dados estruturados. semiestruturados e não estruturados. Nos últimos anos. surgiram os bancos de dados NoSQL (Not Only SQL). que facilitam a manipulação de dados estruturados e semiestruturados. O banco MongoDB. por exemplo. armazena dados em formato de documentos; o Neo4j trabalha com grafos; e o Apache Cassandra armazena dados em formato de colunas. Para dados não estruturados. o HDFS ainda é a opção mais utilizada. Outros "Vs" também são reconhecidos por caracterizar big data. como visibilidade. variabilidade. vulnerabilidade. veracidade. vagueza e visualização — a qual é de grande importância para estudantes da área. Big data envolve dados que não entendemos ou cuja extração de insight é impossível sem apoio de ferramentas e técnicas de visualização. Neste contexto. é essencial saber trabalhar com linguagens de programação como R e Python. além de sistemas como Tableau. que permite o desenvolvimento simplificado de visualizações de dados. Este livro abordará tais conteúdos. introduzindo os principais frameworks para armazenamento. processamento e visualização de dados em big data. Existem centenas de possibilidades de combinações para a criação de um ambiente de big data. e. nesta obra. você estudará sobre os frameworks mais utilizadosSAGAH2020info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/other1 recurso online (0 p.) : il.9786556900803https://biblioteca.slmandic.edu.br/biblioteca/acervo/detalhe/197193porCover: https://biblioteca.slmandic.edu.br/biblioteca/capa/capa?codigo=197193Pereira, Mariana AraújoMilani, Alessandra M. PazNeumann, Fabiano Berlinckreponame:Biblioteca Digital de Teses e Dissertações da Faculdade São Leopoldo Mandicinstname:Faculdade São Leopoldo Mandicinstacron:SLMANDICinfo:eu-repo/semantics/openAccess2025-08-08T11:37:59Zoai:prima.com.br:197193Biblioteca Digital de Teses e DissertaçõesPRIhttps://biblioteca.slmandic.edu.br/biblioteca/oai/oai.aspsamanta.capeletto@slmandic.edu.bropendoar:2025-08-08T11:37:59Biblioteca Digital de Teses e Dissertações da Faculdade São Leopoldo Mandic - Faculdade São Leopoldo Mandicfalse |
| dc.title.none.fl_str_mv |
Framework de big data |
| title |
Framework de big data |
| spellingShingle |
Framework de big data Pereira, Mariana Araújo 0 Ciências da computação MB Exatas |
| title_short |
Framework de big data |
| title_full |
Framework de big data |
| title_fullStr |
Framework de big data |
| title_full_unstemmed |
Framework de big data |
| title_sort |
Framework de big data |
| author |
Pereira, Mariana Araújo |
| author_facet |
Pereira, Mariana Araújo Milani, Alessandra M. Paz Neumann, Fabiano Berlinck |
| author_role |
author |
| author2 |
Milani, Alessandra M. Paz Neumann, Fabiano Berlinck |
| author2_role |
author author |
| dc.contributor.author.fl_str_mv |
Pereira, Mariana Araújo Milani, Alessandra M. Paz Neumann, Fabiano Berlinck |
| dc.subject.por.fl_str_mv |
0 Ciências da computação MB Exatas |
| topic |
0 Ciências da computação MB Exatas |
| description |
As características inerentes ao big data exigem frameworks específicos para que os dados sejam transformados em valor. Velocidade. volume e variedade representam os aspectos de big data mais reconhecidos. Quanto à velocidade. os dados são produzidos de forma constante. e são necessárias aplicações específicas para lidar com o alto fluxo (data streaming). Aplicações da Apache. como Spark Streaming. Flink e Storm são exemplos de sistemas desenvolvidos para auxiliar no tratamento de dados em tempo real. O volume. representado pela imensa quantidade de dados gerados. exige sistemas de arquivos distribuídos. como HDFS (Hadoop). Esses sistemas auxiliam na redução de custos e aumentam a escalabilidade. pois permitem a criação de clusters de computadores com hardware de baixo custo. Em um cluster Hadoop. os dados são replicados de acordo com uma escala muitas vezes igual a 3 (isso significa que cada pedaço de dados estará armazenado em três nós diferentes de um cluster). Se um nó falhar. ainda teremos os mesmos dados em outros dois. e o sistema irá se reajustar para que uma terceira réplica seja criada novamente. Ou seja: hardware de baixo custo tende a falhar. mas um sistema de arquivos distribuído específico para big data resolve o problema. mantendo réplicas para os dados. Ambientes de big data armazenam dados variados. como dados estruturados. semiestruturados e não estruturados. Nos últimos anos. surgiram os bancos de dados NoSQL (Not Only SQL). que facilitam a manipulação de dados estruturados e semiestruturados. O banco MongoDB. por exemplo. armazena dados em formato de documentos; o Neo4j trabalha com grafos; e o Apache Cassandra armazena dados em formato de colunas. Para dados não estruturados. o HDFS ainda é a opção mais utilizada. Outros "Vs" também são reconhecidos por caracterizar big data. como visibilidade. variabilidade. vulnerabilidade. veracidade. vagueza e visualização — a qual é de grande importância para estudantes da área. Big data envolve dados que não entendemos ou cuja extração de insight é impossível sem apoio de ferramentas e técnicas de visualização. Neste contexto. é essencial saber trabalhar com linguagens de programação como R e Python. além de sistemas como Tableau. que permite o desenvolvimento simplificado de visualizações de dados. Este livro abordará tais conteúdos. introduzindo os principais frameworks para armazenamento. processamento e visualização de dados em big data. Existem centenas de possibilidades de combinações para a criação de um ambiente de big data. e. nesta obra. você estudará sobre os frameworks mais utilizados |
| publishDate |
2020 |
| dc.date.none.fl_str_mv |
2020 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/other |
| format |
other |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
9786556900803 https://biblioteca.slmandic.edu.br/biblioteca/acervo/detalhe/197193 |
| identifier_str_mv |
9786556900803 |
| url |
https://biblioteca.slmandic.edu.br/biblioteca/acervo/detalhe/197193 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
Cover: https://biblioteca.slmandic.edu.br/biblioteca/capa/capa?codigo=197193 |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
1 recurso online (0 p.) : il. |
| dc.publisher.none.fl_str_mv |
SAGAH |
| publisher.none.fl_str_mv |
SAGAH |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Faculdade São Leopoldo Mandic instname:Faculdade São Leopoldo Mandic instacron:SLMANDIC |
| instname_str |
Faculdade São Leopoldo Mandic |
| instacron_str |
SLMANDIC |
| institution |
SLMANDIC |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da Faculdade São Leopoldo Mandic |
| collection |
Biblioteca Digital de Teses e Dissertações da Faculdade São Leopoldo Mandic |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Faculdade São Leopoldo Mandic - Faculdade São Leopoldo Mandic |
| repository.mail.fl_str_mv |
samanta.capeletto@slmandic.edu.br |
| _version_ |
1847096323821535232 |