Saiba como proteger a análise de big data

Publicado:

Leitura 3 minutos

Saiba como proteger a análise de big data

A proteção de dados é, muitas vezes, a parte esquecida de qualquer tendência no centro de dados, e o lançamento de iniciativas de big data não é exceção a esta tendência. Geralmente, a proteção de dados é uma reflexão tardia. O que é particularmente difícil com big data, especialmente com análise de big data, é que esse conceito é a tempestade perfeita para um desastre de proteção de dados.

A análise de big data tem todos os fatores que você não quer ver quando tenta proteger suas informações. Primeiro, ela pode ter um conjunto de amostras muito original – por exemplo, um dispositivo que monitora uma amostra de solo a cada 30 segundos, uma câmera que tira milhares de imagens, ou uma célula de callcenter que registra milhões de mensagens de texto. Toda essa informação é única para aquele momento, se for perdida é impossível de ser recriada.

As melhores notícias de tecnologia B2B
Acompanhe todas as novidades diretamente na sua caixa de entrada

Essa singularidade também significa que os dados provavelmente não são duplicáveis. Você pode precisar desligar a deduplicação, ou pelo menos utilizá-la em uma taxa de efetividade muito baixa em tais ambientes. Isso significa que a capacidade do aparelho de realizar uma cópia de segurança pode ter de ser perto do que o conjunto de dados reais em comparação com outras situações de backup onde se pode contar com um elevado nível de eficácia dedupe.

O grande número de arquivos que podem ser residentes em  ambientes de análise de big data também é um desafio. Para fazer com que as aplicações de backup e appliance funcionem nesse grande número de arquivos, a banda para o servidor backup e/ou appliance de backup precisa ser maior e os dispositivos de recepção devem estar aptos a ingerir as informações a taxas em que os dados devem ser entregues. Eles também precisam de um CPU com poder de processamento significante para analisar todos os dados.

Há ainda componentes de base de dados para big data que têm que ser considerados. Análise de informações é, geralmente, processada em ambientes do tipo Oracle ou Hadoop, então, proteção ativa para esses ambientes pode ser necessária. Isso quer dizer que um pequeno número de grandes arquivos precisam ser guardados.

Esse é o pior caso de mistura de carga de trabalho de alta performance: bilhões de pequenos arquivos com um pequeno número de grandes arquivos, que podem quebrar muitas appliances de backup. Encontrar um que pode ingerir esta carga de trabalho mista de dados na velocidade máxima; que tem uma configuração de deduplicação que não vai afetar o desempenho; e que pode chegar a grande capacidade pode ser o maior desafio no grande mercado de backup de dados.

A outra forma de big data, o arquivo de big data, deve ser um problema menor se for projetado corretamente. Se o projeto usa fita como parte do arquivo, então o backup pode ser construído como parte do fluxo de trabalho.

Saiba mais:

Conheça os 4 impactos críticos de big data

Consumo de dados deve crescer 50 vezes até 2020, diz SAS

Big Data é questão de tempo, diz Google Brasil

Com big data, surgem dois perfis de profissionais de Data Warehouse

 

Notícias relacionadas

Ver mais Seta para direita