Tecnologia para Big Data

Um dos primeiros passos para lidar com big data é o planejamento. Com um projeto bem feito, deve ser levado em consideração que tipo de dado, com que frequência e em quais condições os dados se encontram. Sobre os primeiros passos em um projeto de big data, analise as afirmações a seguir:

I. ETL é um processo importante na obtenção de dados.
II. Com os dados disponíveis, o sistema pode começar a processá-los para exibir informações reais.
III. Os requisitos básicos para trabalhar com big data não são os mesmos utilizados para trabalhar com conjuntos de dados de qualquer tamanho.

R:  I e II, apenas.


Um dos maiores desafios em sistemas de armazenamento de dados é a escalabilidade: a capacidade de crescimento de maneira escalar. Esse é um dos problemas mais comuns e importantes que toda empresa enfrenta. Lida-se com negócios em crescimento, causando armazenamento exponencial de dados, com necessidade e grande demanda de disponibilidade deles.

Em termos de dados e sistemas, analise as afirmações a seguir sobre escalabilidade:

I. Característica de um sistema que descreve sua capacidade de lidar e executar bem sob aumento ou expansão.

II. Capacidade de lidar com crescimento sem ser prejudicada por sua estrutura ou recursos disponíveis.

III. Possibilidade de atender a diversas demandas ao mesmo tempo.

IV. Está diretamente ligada a bancos de dados relacionais.

Está correto o que se afirma em:

R: I, II e III.


O paradigma de programação MapReduce demonstrou ser adequado para trabalhar com problemas que podem ser particionados ou fragmentados em subproblemas. Isso porque se pode aplicar separadamente as funções map e reduce a um conjunto de dados.

Sobre essas funções, analise as afirmativas a seguir e assinale a correta:

R: As funções map e reduce são normalmente utilizadas juntas, especificando que a saída da função map será a entrada da função reduce.


O Apache Hadoop é um framework que simplifica o trabalho com sistemas distribuídos, tornando transparentes diversas funções. Assinale a alternativa que apresenta uma característica do Hadoop:

R: O Hadoop oferece estratégias automáticas para garantir o processamento em caso de falhas em computadores alocados para o processamento, garantindo continuidade.


Diversas expressões se tornam cada vez mais comuns, tanto entre profissionais de Tecnologia da Informação (TI) quanto entre profissionais de outras áreas.

Assinale a alternativa correta a respeito do conceito de stream de dados.

R: Fazem parte dos dados que alimentam sistemas de big data.


 

Deixe um comentário