• Questão 9:
    • Data mining:
      • Objetivo: vasculhar uma grande quantidade de dados armazenados em depósito de dados, banco de dados ou outros repositórios de informação.
      • Etapas básicas: exploração, construção de modelo, definição de padrão e validação e verificação
      • Tarefas: detecção de anomalias, aprendizagem da regra de associação (modelo de dependência), clustering (agrupamento), classificação, regressão e sumarização.
      • Etapas aprofundadas:
        • Análise do problema: selecionar os dados e definir as técnicas utilizadas na análise.
        • Preparação dos Dados: Coletânea de dados, Avaliação, Consolidação e limpeza, Seleção de dados e Transformação
        • Modelagem: gera um modelo a ser analisado posteriormente.
        • Análise e validação de resultados: visa detectar o que há de implícito num modelo.
      • Exemplos: Wal- Mart, Telecomunicações, Administração em Alto Nível, Medicina
      • Ferramentas: RapidMiner, MOA Massive Online Analysis, WEKA, Enterprise Miner.
    • Datawarehouse:
      • Objetivo: armazenar em um único local, somente os dados considerados uteis no momento de tomar decisões
      • O que é? coleção de dados orientada por assuntos, integrada, variante no tempo, que tem por objetivo dar suporte aos processos de tomada de decisão.
      • Funções:
        • Permitem que sistemas mais antigos continuem em operação
        • Consolidam dados inconsistentes dos sistemas mais antigos em conjuntos coerentes
        • Extraem benefícios de novas informações oriundas das operações correntes
        • Provém ambiente para o planejamento e arquitetura de novos sistemas de cunho operacional
      • Exemplos: empresas de transporte aéreo
      • Ferramentas: Hive.
    • NoSQL:
      • Objetivo: suprir necessidades em demandas onde os bancos de dados relacionais são ineficazes
      • Vantagem: tem uma grande facilidade na distribuição horizontal, ou seja, mais dados, mais servidores, não necessariamente de alta performance e são muito tolerantes a erros
      • Requisitos:
        • alta performance
        • escalabilidade
        • replicação
        • suporte à dados estruturados e sub colunas
      • Núcleos:
        • Wide Column Store/Column Families
        • Document Store
        • Key Value/Tuple Store
        • Eventually Consistent Key Value Store
        • Graph Databases
        • Object Databases
        • Grid Database Solutions
        • XML Databases
      • Exemplos: Google, Hypertable


  • Questão 10:
    • BI: