|
|
| (17 revisões intermediárias por 3 usuários não estão sendo mostradas) |
| Linha 1: |
Linha 1: |
| '''Oque é o Big Date?
| | = Conceito = |
| '''
| | <br> |
| Big Data é um termo popular usado para descrever o crescimento, a disponibilidade e o uso exponencial de informações estruturadas e não estruturadas. Muito tem sido escrito sobre Big Data e como ele pode servir como base para a inovação, diferenciação e crescimento. A princípio, podemos definir o conceito de Big Data como sendo conjuntos de dados extremamente grandes e que, por este motivo, necessitam de ferramentas especialmente preparadas para lidar com grandes volumes, de forma que toda e qualquer informação nestes meios possa ser encontrada, analisada e aproveitada em tempo hábil.
| |
| Exemplo O Facebook é um exemplo de empresa que se beneficia de Big Data: as bases de dados do serviço aumentam todo dia e são utilizadas para determinar relações, preferências e comportamentos dos usuários
| |
|
| |
|
| '''Por que o Big Date é tão importante?'''
| | * |
| As tecnologias atuais nos permitiram - e permitem - aumentar exponencialmente a quantidade de informações no mundo e, agora, empresas, governos e outras instituições precisam saber lidar com esta "explosão" de dados. O Big Data se propõe a ajudar nesta tarefa, uma vez que as ferramentas computacionais usadas até então para gestão de dados, por si só, já não podem fazê-lo satisfatoriamente.A quantidade de dados gerada e armazenada diariamente chegou a tal ponto que, hoje, uma estrutura centralizada de processamento de dados já não faz mais sentido para a maioria absoluta das grandes entidades.
| | <br> |
|
| |
|
| '''Os 'Vs' do Big Data.'''
| |
| Podemos dizer que o big data se baseia em 5V’s velocidade, volume, variedade, veracidade e valor.
| |
| Velocidade:Para dar conta de determinados problemas, o tratamento dos dados (obtenção, gravação, atualização, enfim) deve ser feito em tempo hábil - muitas vezes em tempo real. Se o tamanho do banco de dados for um fator limitante, o negócio pode ser prejudicado: imagine, por exemplo, o transtorno que uma operadora de cartão de crédito teria - e causaria - se demorasse horas para aprovar um transação de um cliente pelo fato de o seu sistema de segurança não conseguir analisar rapidamente todos os dados que podem indicar uma fraude.
| |
| Volume:Estamos falando de quantidades de dados realmente grandes, que crescem exponencialmente e que, não raramente, são subutilizados justamente por estarem nestas condições.
| |
|
| |
|
| '''Variedade''':Os volume de dados que temos hoje são consequência também da diversidade de informações. Temos dados em formato estruturados, isto é, armazenados em bancos como PostgreSQL e Oracle, e dados não estruturados oriundos de inúmeras fontes, como documentos, imagens, áudios, vídeos e assim por diante. É necessário saber tratar a variedade como parte de um todo - um tipo de dado pode ser inútil se não for associado a outros.
| |
|
| |
|
| '''Veracidade''':Não adianta muita coisa lidar com a combinação "volume + velocidade + variedade" se houver dados não confiáveis. É necessário que haja processos que garantam o máximo possível a consistência dos dados. Voltando ao exemplo da operadora de cartão de crédito, imagine o problema que a empresa teria se o seu sistema bloqueasse uma transação genuína por analisar dados não condizentes com a realidade.
| | == Banco de Dados para Big Data == |
| | <br> |
|
| |
|
| '''Valor''':informação é poder, informação é patrimônio. A combinação "volume + velocidade + variedade + veracidade", além de todo e qualquer outro aspecto que caracteriza uma solução de Big Data, se mostrará inviável se o resultado não trouxer benefícios significativos e que
| | * |
| compensem o investimento. Este é o aspecto do valor
| | <br> |
|
| |
|
| É claro que estes cinco aspectos não precisam ser tomados como a definição perfeita. Há quem acredite, por exemplo, que a combinação "volume + velocidade + variedade" seja suficiente para transmitir uma noção aceitável do Big Data. Sob esta óptica, os aspectos da
| |
| veracidade e do valor seriam desnecessários, porque já estão implícitos no negócio - qualquer entidade séria sabe que precisa de dados consistentes; nenhuma entidade toma decisões e investe se não houver expectativa de retorno.
| |
| '''Solução de Big Date'''
| |
| Além de lidar com volumes extremamente grandes de dados dos mais variados tipos, soluções de Big Data também precisam trabalhar com distribuição de processamento e elasticidade, isto é, suportar aplicações com volumes de dados que crescem substancialmente em pouco tempo.
| |
|
| |
|
| O problema é que os bancos de dados "tradicionais", especialmente aqueles que exploram o modelo relacional, como o MySQL, o PostgreSQL e o Oracle, não se mostram adequados a estes requisitos, já que são menos flexíveis.
| | = Elementos do Big Data = |
| Isso acontece porque bancos de dados relacionais normalmente se baseiam em quatro propriedades que tornam a sua adoção segura e eficiente, razão pela qual soluções do tipo são tão populares: Atomicidade, Consistência, Isolamento e Durabilidade. Esta combinação é conhecida como ACID, sigla para o uso destes termos em inglês: Atomicity, Consistency, Isolation e Durability.
| |
|
| |
|
| Vejamos uma breve descrição de cada uma:
| | <br> |
| Atomicidade: toda transação deve ser atômica, isto é, só pode ser considerada efetivada se executada completamente;
| |
| Consistência: todas as regras aplicadas ao banco de dados devem ser seguidas; Isolamento: nenhuma transação pode interferir em outra que esteja em andamento ao mesmo tempo;
| |
| Durabilidade: uma vez que a transação esteja concluída, os dados consequentes não podem ser perdidos.
| |
|
| |
|
| Não é que bancos de dados relacionais tenham ficado ultrapassados - eles são e continuarão por muito tempo sendo úteis a uma série de aplicações. O que acontece é que, geralmente, quanto maior um banco de dados se torna, mais custoso e trabalhoso ele fica: é preciso otimizar, acrescentar novos servidores, empregar mais especialistas em sua manutenção, enfim. Via de regra, escalar (torná-lo maior) um bancos de dados NoSQL é mais fácil e menos custoso. Isso é possível porque, além de contar com propriedades mais flexíveis, bancos do tipo já são otimizados para trabalhar com processamento paralelo, distribuição global (vários data centers), aumento imediato de sua capacidade e outros.
| | * |
| | <br> |
|
| |
|
| '''Conclusão'''
| | * |
| Não podemos considerar as soluções de Big Data como um arsenal computacional perfeito: sistemas do tipo são complexos, ainda desconhecidos por muitos gestores e profissionais de TI e a sua própria definição ainda é passível de discussão.
| | |
| O fato é que a ideia de Big Data reflete um cenário real: há, cada vez mais, volumes de dados gigantescos e que, portanto, exigem uma abordagem capaz de aproveitá-los ao máximo. Apenas para dar uma noção deste desafio, a IBM divulgou no final de 2012 que, de acordo com as suas estimativas, 90% dos dados disponíveis no mundo foram gerados apenas nos dois anos anteriores. Diante deste ponto de vista, é um tanto quanto precipitado encarar a expressão "Big Data" como uma mero "termo da moda".
| | |
| | == Volume == |
| | |
| | <br> |
| | |
| | * |
| | <br> |
| | |
| | |
| | == Velocidade == |
| | |
| | <br> |
| | |
| | * |
| | <br> |
| | |
| | |
| | == Variedade == |
| | |
| | <br> |
| | |
| | * |
| | <br> |
| | |
| | |
| | |
| | == Veracidade == |
| | |
| | <br> |
| | |
| | * |
| | <br> |
| | |
| | |
| | == Valor == |
| | <br> |
| | |
| | * |
| | <br> |
| | |
| | = Cases em uso no Brasil ou no mundo = |
| | |
| | <br> |
| | |
| | * |
| | <br> |
| | |
| | |
| | <br> |
| | |
| | * |
| | <br> |
| | |
| | |
| | = Referências bibliográficas = |
| | <br> |
| | |
| | * |
| | <br> |