Existe um?
Todas as definições que posso encontrar descrevem o tamanho, complexidade / variedade ou velocidade dos dados.
A definição da Wikipedia é a única que encontrei com um número real
Os tamanhos de big data são um alvo em constante movimento, a partir de 2012, variando de algumas dezenas de terabytes a muitos petabytes de dados em um único conjunto de dados.
No entanto, isso aparentemente contradiz a definição do MIKE2.0 , mencionada no próximo parágrafo, que indica que "dados grandes" podem ser pequenos e que 100.000 sensores em uma aeronave que cria apenas 3 GB de dados podem ser considerados grandes.
IBM apesar de dizer que:
O big data é mais simples do que uma questão de tamanho.
enfatizaram o tamanho em sua definição .
O'Reilly também enfatizou "volume, velocity and variety"
. Embora bem explicada, e com mais profundidade, a definição parece ser um re-hash dos outros - ou vice-versa, é claro.
Eu acho que um computador semanais artigo título resume uma série de artigos bastante bem "O que é big data e como ele pode ser usado para ganhar vantagem competitiva" .
Mas o ZDNet vence com o seguinte a partir de 2012 :
"Big Data" é um slogan que vem borbulhando do nicho de computação de alto desempenho do mercado de TI ... Se alguém se deparar com as apresentações de dez fornecedores de tecnologia, é provável que quinze definições diferentes sejam apresentadas. Cada definição, é claro, tende a apoiar a necessidade dos produtos e serviços desse fornecedor. Imagine isso.
Basicamente, "big data" é "grande" de alguma forma ou forma.
O que é "grande"? É quantificável no momento atual?
Se "grande" não é quantificável, existe uma definição que não se baseie apenas em generalidades?
Respostas:
Não há um; é um chavão.
O delineador, porém, é que seus dados estão além dos recursos dos sistemas tradicionais. Os dados são grandes demais para serem armazenados no disco maior, as consultas demoram muito tempo sem otimização especial, a rede ou o disco não suporta o fluxo de tráfego recebido, uma visualização de dados antiga simples não processa a visualização da forma / tamanho / amplitude de dados ...
Basicamente, seus dados estão além de um ponto de inflexão mal definido, onde "basta adicionar mais hardware" não será suficiente.
fonte
Conforme indicado no link Oracle (comentário por Immad Careem), oracle.com/us/technologies/big-data/index.html. O Big Data é tudo o que não é um dado relacional armazenado em um RDBMS. Poucos anos antes do hype, eram apenas "muitos dados". Agora, ele cresceu e foi promovido pelos profissionais de marketing para ser algum tipo de dado especial.
Existem vários motivos secundários (além do marketing) para considerar o Big Data uma coisa real.
fonte
Usando a resposta de Doug Laney como ponto de partida, fizemos uma engenharia reversa de uma lista de definições de Big Data, agora com mais de 30 anos e que estão se fortalecendo. Nossa lista de definições para "Big Data" está localizada aqui .
Congratulamo-nos com correções, entradas, gráficos, etc.
fonte
É ótimo ver O'Reilly e outros finalmente se agarrarem aos 3Vs de big data do Gartner que introduzimos pela primeira vez há 11 anos. Para referência, aqui está a peça original que escrevi em 2001: http://blogs.gartner.com/doug-laney/deja-vvvue-others-claiming-gartners-volume-velocity-variety-construct-for-big-data/ .
A definição atualizada recentemente do Gartner também reconhece o aspecto do valor: "Big Data são ativos de informação com volumes, velocidades e / ou variedade que exigem formas inovadoras de processamento de informações para descoberta aprimorada de insights, tomada de decisão e automação de processos".
Também desenvolvemos um método para quantificar a magnitude dos dados ao longo dos três vetores que são prescritivos em termos de adoção de tecnologia. No entanto, não posso compartilhá-lo publicamente.
fonte