Um dos primeiros passos para lidar com big data é o planejamento. Com um projeto bem feito, deve ser levado em consideração que tipo de dado, com que frequência e em quais condições os dados se encontram. Sobre os primeiros passos em um projeto de big data, analise as afirmações a seguir:
I. ETL é um processo importante na obtenção de dados.
II. Com os dados disponíveis, o sistema pode começar a processá-los para exibir informações reais.
III. Os requisitos básicos para trabalhar com big data não são os mesmos utilizados para trabalhar com conjuntos de dados de qualquer tamanho.
R: I e II, apenas.
Um dos maiores desafios em sistemas de armazenamento de dados é a escalabilidade: a capacidade de crescimento de maneira escalar. Esse é um dos problemas mais comuns e importantes que toda empresa enfrenta. Lida-se com negócios em crescimento, causando armazenamento exponencial de dados, com necessidade e grande demanda de disponibilidade deles.
Em termos de dados e sistemas, analise as afirmações a seguir sobre escalabilidade:
I. Característica de um sistema que descreve sua capacidade de lidar e executar bem sob aumento ou expansão.
II. Capacidade de lidar com crescimento sem ser prejudicada por sua estrutura ou recursos disponíveis.
III. Possibilidade de atender a diversas demandas ao mesmo tempo.
IV. Está diretamente ligada a bancos de dados relacionais.
Está correto o que se afirma em:
R: I, II e III.
O paradigma de programação MapReduce demonstrou ser adequado para trabalhar com problemas que podem ser particionados ou fragmentados em subproblemas. Isso porque se pode aplicar separadamente as funções map e reduce a um conjunto de dados.
Sobre essas funções, analise as afirmativas a seguir e assinale a correta:
R: As funções map e reduce são normalmente utilizadas juntas, especificando que a saída da função map será a entrada da função reduce.
O Apache Hadoop é um framework que simplifica o trabalho com sistemas distribuídos, tornando transparentes diversas funções. Assinale a alternativa que apresenta uma característica do Hadoop:
R: O Hadoop oferece estratégias automáticas para garantir o processamento em caso de falhas em computadores alocados para o processamento, garantindo continuidade.
Diversas expressões se tornam cada vez mais comuns, tanto entre profissionais de Tecnologia da Informação (TI) quanto entre profissionais de outras áreas.
Assinale a alternativa correta a respeito do conceito de stream de dados.
R: Fazem parte dos dados que alimentam sistemas de big data.