Esta pesquisa deve fornecer um conteúdo atualizado sobre o tema acima. Não esqueça de incluir as referëncias (fontes) no último item, reforçando que não deve ser um Copy/Paste e sim uma síntese das pesquisas que fizer.
Conceito
Pode-se definir Big Data por meio dos 4 V's:
- Volume:
Organizações coletam dados de uma grande variedade de fontes, incluindo transações comerciais, redes sociais e informações de sensores ou dados transmitidos de máquina a máquina.
- Velocidade:
Os dados fluem em uma velocidade sem precedentes e devem ser tratados em tempo hábil. Sensores, celulares e contadores inteligentes estão impulsionado a necessidade de lidar com imensas quantidades de dados em tempo real, ou quase real.
- Variedade:
Os dados são gerados em todos os tipos de formatos: de dados estruturados, dados numéricos em bancos de dados tradicionais, até documentos de texto não estruturados, e-mail, vídeo, áudio, dados de cotações da bolsa e transações financeiras.
- Valor:
É resultante da combinação de todos os aspectos citados acima. Assim, o resultado não terá sentido algum se não trouxer benefícios significativos e que compensem todo o investimento.
Assim, simplificando, o Big Data é entendido como os conjuntos de dados de grande volume (estruturados e não estruturados) e que necessitam de ferramentas especiais para lidar com grandes quantidades, de forma que todas as informações possam ser encontradas, analisadas e também aproveitadas no tempo necessário.
Software
Alguns softwares que fazem a composição do Big Data:
- Automação de serviços de nuvem
Software de gerenciamento de nuvem que permite que uma empresa aproveite com facilidade os benefícios de serviços de nuvem seguros e compatíveis. Automatize e simplifique a implantação e o gerenciamento de sua opção de serviços de TI híbridos.
Ofereçe aos usuários de linha de negócios um portal personalizável, intuitivo e de autoatendimento com uma experiência moderna de compra por meio de catálogo e recursos de combinações; Elimina a dependência de fornecedor usando suporte de API REST aberto e extensível para hardware multi-hipervisor e multifornecedor, incluindo nuvem privada e pública; Implanta infraestrutura avançada e serviços de plataforma de aplicativos em várias camadas usando um designer de serviço gráfico, flexível e incorporado; Simplifica a administração usando um conjunto de ferramentas de gerenciamento de operações de TI completo com uma experiência em um único lugar em TI tradicional e nuvens privadas e públicas.
- Automação de servidores
Diminui o tempo de paralisação e o risco da configuração manual, enquanto reduz em 90% o tempo gasto em provisionamento de servidor, gerenciamento de patches de servidor e manutenção da segurança em servidores gerenciados. Gerencia facilmente a instalação, a atualização, a remoção e a geração de relatórios para empacotamento proprietário, arquivos importados, objetos e scripts de configuração.
- Ferramenta de prontidão de adoção (ART)
Reduz os custos de suporte sendo proativo no treinamento de sua força de trabalho; Obtem-se o ROI com mais rapidez capacitando os usuários para uma adoção bem-sucedida; Diminui o risco utilizando usuários que tenham treinamento completo.
Aplicações
O Big Data pode ser aplicado nos seguintes itens:
- Banco
Com grandes quantidades de informações fluindo partir inúmeras fontes, os bancos são desafiados a encontrar maneiras novas e inovadoras de gerenciar Big Data. Ao mesmo tempo em que Big Data é importante para compreender os clientes e aumentar sua satisfação, é igualmente importante para minimizar os riscos e fraudes enquanto mantém uma conformidade regulatória. Big Data traz ótimos insights, mas também exige que as instituições financeiras estejam um passo à frente neste jogo, com análises avançadas.
- Governo
Quando as organizações governamentais são capazes de aproveitar e aplicar analytics em Big Data, elas progridem significativamente quando se trata de gerenciar serviços públicos, lidar com o congestionamento ou a prevenir a criminalidade.
- Saúde
Registros de pacientes, planos de tratamento, informações de prescrição. Quando se trata de cuidados com a saúde, tudo precisa ser feito rapidamente com precisão. Quando grandes quantidades de dados são geridas de forma eficaz, os prestadores de cuidados de saúde podem descobrir insights escondidos que melhoram o atendimento ao paciente.
- Ensino
Educadores com uma visão orientada a dados podem ter um impacto significativo sobre os sistemas escolares, estudantes e currículos. Analisando Big Data, eles podem identificar alunos e assegurar que os estudantes estão progredindo de forma adequada, e podem implementar um sistema melhor de avaliação e apoio aos professores e diretores.
- Manufatura
Com uma visão que Big Data pode fornecer, os fabricantes podem aumentar a qualidade e a produção, minimizando o desperdício. Cada vez mais fabricantes estão trabalhando em uma cultura baseada em análise de dados, o que significa que eles podem resolver problemas mais rapidamente e tomar decisões de negócios mais ágeis.
Tecnologias
- Hadoop
O projeto Apache Hadoop tem dois componentes principais, o armazenamento de arquivo chamado Hadoop Distributed File System (HDFS) e a estrutura de programação chamada MapReduce.
HDFS: Se você quiser que 4000+ computadores funcionem em seus dados, é melhor espalhar seus dados em 4000+ computadores. HDFS faz isso para você. HDFS tem algumas partes móveis. O Datanodes armazena seus dados e o Namenode controla onde suas coisas são armazenadas.
MapReduce: Esse é o modelo programático para Hadoop. Há duas fases, chamados de Map e Reduce. O JobTracker gerenciar os 4000+ componentes de seu trabalho MapReduce. O TaskTrackers recebe ordens do JobTracker. Se você gosta de Java, codifique em Java. Se você gostar de SQL ou de outras linguagens diferentes de Java, é possível usar um utilitário chamado Hadoop Streaming.
Hadoop Streaming: Um utilitário que permite ao MapReduce codificar em qualquer linguagem: C, Perl, Python, C++, Bash etc. Os exemplos incluem um mapeador Python e um redutor AWK.
- HPE Moonshot
Uma usina de carga de trabalho ultra convergente que aplica processamento na menor da escalas, para tornar o acesso instantâneo e o processamento altamente eficiente.
- HPE Apollo 4000
Análise e armazenamento de objetos. Foque em dados com mineração de dados baseada em Hadoop e análise baseada em NoSQL. Implemente armazenamento de objetos com volumes de dados em escala de petabyte.
Analytics
- A análise de dados é o processo de coleta, organização e análise de grandes conjuntos de dados para descobrir padrões e outras informações úteis. Análise de dados podem ajudar as organizações a compreender melhor as informações contidas dentro dos dados e também vai ajudar a identificar os dados que é mais importante para os negócios e decisões de negócios futuros.
- Para analisar um grande volume de dados, tais, análise de Big Data é tipicamente realizada utilizando ferramentas de software e aplicativos especializados para análise preditiva, mineração de dados, mineração de texto, previsão e otimização de dados. Usando grandes ferramentas de dados e software permite que uma organização consiga processar extremamente grandes volumes de dados que uma empresa tenha coletado para determinar quais dados são relevantes e podem ser analisados para tomar melhores decisões de negócios no futuro.
Vantagens
São vários os benefícios oferecidos pelo Big Data, dentre eles estão:
- Redução do custos e de tempo;
- Desenvolvimento de novos produtos e ofertas otimizadas;
- Determinar a causa raiz de falhas, problemas e defeitos em tempo quase real;
- Gerar cupons no ponto de venda com base em hábitos de compra dos clientes;
- Recalcular carteiras de risco inteiras, em questão de minutos;
- Detectar comportamentos fraudulentos antes que eles afetem sua organização.
Referências Bibliográficas
http://slides.com/lclaudio/apresentacao-1-5-6-16-19#/
http://harvardmagazine.com/2014/03/why-big-data-is-a-big-deal
http://www.ies.ufpb.br/ojs2/index.php/itec/article/view/19380/11156
http://www.infowester.com/big-data.php
https://www.oficinadanet.com.br/post/13252-o-que-e-big-data
http://www.sas.com/pt_br/insights/analytics/what-is-analytics.html
http://www.webopedia.com/TERM/B/big_data_analytics.html
http://www8.hp.com/br/pt/software-solutions/enterprise-software-products-a-z.html?view=list