BI não é Big Data

A definição de Business Intelligence foi mudando e se adaptando ao longo do tempo a partir das mentes de variados autores, no entanto, para mim, a de Howard Dresner, escrita em 1988 continua sendo atual. Para ele BI é “conceitos e métodos para melhorar a tomada de decisão de negócios, utilizando sistemas de apoio, baseados em fatos. ”

Atualmente o conceito mais aceito entre os especialistas é o definido pelo Gartner, “is an umbrella term that includes the applications, infrastructure and tools, and best practices that enable access to and analysis of information to improve and optimize decisions and performance”.

Conceitos Básicos

Não conseguimos diferenciar BI de Big Data sem antes formalizar alguns conceitos. O primeiro passo é entender o que são dados estruturados e não estruturados.

Dados estruturados: São dados organizados e relacionados, geralmente oriundos de bancos de dados relacionais.

Dados não estruturados: Dados não organizados ou não facilmente relacionados, geralmente associados a bancos de dados de chave-valor como NoSql e bancos de dados não convencionais.

Tanto no BI como no Big Data, o objetivo é consultar os dados e exibir informação, para que essa informação possa ser analisada e transformada em conhecimento, e, a partir deste conhecimento pode-se tomar as decisões assertivas.

 BI não é Big Data

Como já vimos os conceitos do BI e vou escrever muito sobre eles nos próximos posts, vamos focar no Big Data. Ele tem basicamente os mesmos conceitos do BI, porém ele é baseado em V’s. Inicialmente se falavam em 3V’s, volume, variedade e velocidade. Algum tempo depois, outros autores acrescentaram a estes conceitos mais 2V’s, veracidade e valor. Em resumo, para se ter um projeto de Big Data, obrigatoriamente você precisa ter um grande volume de dados, sendo alimentado por diversas fontes diferentes, sejam elas estruturadas ou não, e uma rápida resposta às perguntas feitas, além disto, precisa ter veracidade e valor nas informações coletadas.

Eu posso te um BI com grande volume de dados ? Sim. Posso ter BI com rápida resposta às perguntas? Sim. Então qual a diferença entre BI e Big Data? Basicamente a organização dos dados. Tanto o BI quanto o Big Data podem ter diferentes fontes de dados, mas, para o BI funcionar, é preciso organizar estes dados em um banco de dados estruturado, o DW, que falaremos no decorrer do texto. Se temos todas estas características e os dados não precisaram ser estruturados, é Big Data. Estruturou, é BI. Ponto.

Por que preciso de BI ?

Para contextualizar o problema, vamos simular a seguinte situação:

Uma empresa de Logística

  • No início utilizava o MS Excel para controlar os seus dados financeiros.
  • A empresa cresceu e migrou suas informações para o MS Access.
  • Passados alguns anos e a empresa precisou contratar alguns profissionais de TI para fazer os sistemas.
  • A TI passou a fazer programas na linguagem Visual Basic utilizando o banco de dados SQL Server.
  • A empresa precisou de algo rápido e comprou um programa de Terceiros com o Banco de dados Oracle.
  • A empresa cresceu ainda mais, e para centralizar as informações começou a migrar os dados para um ERP SAP.
  • O setor de almoxarifado, descontente com os programas, continuou fazendo o trabalho no MS Excel.
  • A comprovação dos pagamentos com cartão de crédito é enviado pelos bancos através de arquivos de texto.

Neste caso, a empresa possui 5 fontes de dados diferentes

Se temos tantas fontes, como faremos para consultar os dados com rapidez e segurança a fim de proporcionar uma resposta rápida para os clientes?

A resposta é, devemos centralizar os dados. E onde centralizaremos estes dados ?

Em um banco de dados chamado de Data Warehouse. Este banco de dados precisa utilizar uma arquitetura específica, uma modelagem diferente a qual damos o nome de Modelagem DW ou Modelagem Multidimensional. Mas isto é

assunto para o próximo post.

 

Leave Comment

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *