Os mitos (ainda existentes) sobre Big Data

Por se tratar de um conceito ainda recente, ainda há muitas dúvidas sobre o que é verdade e o que é mito sobre Big Data. No livro Big Data – Técnicas e tecnologias para extração de valor dos dados, apresento algumas informações que você já pode ter lido/escutado em algum momento sobre esse tema, mas que não retratam a realidade.

1. Big Data engloba somente dados não estruturados.

Com o crescente volume de dados nos últimos anos, o banco de dados relacional precisou ser complementado com outras estruturas, devido principalmente à escalabilidade e flexibilidade de armazenamento. Entretanto, os dados relacionais continuam (e continuarão) sendo valiosos e são muito utilizados em soluções de Big Data. O que mudou de fato foi a inclusão de mais tipos de dados, além dos estruturados.

2. Big Data refere-se somente a soluções com petabytes de dados.

Embora o volume de dados seja o fator que impulsionou o fenômeno Big Data, aplicações que utilizam conjuntos de dados em uma escala menor do que petabytes também podem se beneficiar das tecnologias de Big Data. Afinal, o mais importante nessas aplicações é a capacidade de extrair valor dos dados. Se as tecnologias tradicionais disponíveis para você executar funções como carregar uma base de dados, processar uma informação, gerar um relatório analítico e criar um modelo não oferecem o desempenho necessário, é muito provável que você uma tecnologia de Big Data pode ser o que você precisa.

3. Big Data é aplicado somente às empresas do Vale do Silício.

Quando se fala sobre Big Data, é comum que sejam usados como exemplos as grandes empresas de serviços Web do Vale do Silício, tais como o Facebook, Twitter e Netflix. Embora elas tenham sido as primeiras a serem desafiadas com o grande volume, variedade e velocidade de dados, atualmente empresas de diversos outros domínios, como agricultura e varejo, também necessitam de tecnologias de Big Data para atender suas necessidades em relação aos dados que elas adquirem. Um exemplo é o serviço oferecido pela startup brasileira Cobli, que, por meio de dispositivo OBD (on board diagnostic) instalado sob o painel do veículo, oferece um sistema que alimenta uma base de grande volume de dados, auxiliando empresas de logística a traçar melhores rotas, reduzindo custos com combustível e desgaste dos veículos.

4. Big Data é aplicado somente às grandes empresas.

Ainda há essa percepção de que Big Data oferece valor somente para grandes organizações. Entretanto, pequenas e médias empresas também podem obter vantagem competitiva por meio de soluções de Big Data, oferecendo uma melhor experiência aos seus clientes, otimizando processos, reduzindo custos ou criando novos produtos e serviços orientados por dados.

5. Big Data requer o uso de dados externos.

Embora a adoção de dados de diferentes fontes seja uma prática muito adotada em soluções de Big Data, a aquisição de dados externos não é um requisito obrigatório. Na verdade, principalmente para provas de conceito, a sugestão para quem inicia um projeto de Big Data é buscar extrair valor primeiramente dos dados internos, para somente depois ampliar sua jornada utilizando dados de terceiros. E acredite, há muitos dados internos que oferecem informações significativas para a empresa (documentos gerados pelos colaboradores, registros de log, dados de sensores gerados pela empresa, …), mas que são normalmente descartados do processo de tomada de decisão. Temos como exemplo um caso de uso da Microsoft, que criou uma solução guiada por dados para melhorar a eficiência energética da sede, analisando dados de sensores.

6. As tecnologias de Big Data já estão bem estabelecidas.

Infelizmente (ou felizmente, se pensarmos nas oportunidades) não. Estamos vivendo um momento de transição de soluções tradicionais para tecnologias de Big Data. Novas soluções surgem a cada dia, nos oferecendo hoje diversas possibilidades, tais como Spark, Hive e Zeppelin. Portanto, se você for atuar em um projeto de Big Data deve ficar sempre atento ao surgimento de novas versões das tecnologias adotadas, bem como verificar o surgimento de tecnologias complementares presentes no mercado. Mesmo a tecnologia Hadoop, uma das mais estabelecidas nessa área, está em constante evolução e por isso recomenda-se uma avaliação periódica sobre suas atualizações.

Além desses, você acredita que exista outros mitos em relação à Big Data?

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s