Questões
- DAdos ----> Decisão
- Descritivo: o que aconteceu
- Diagnóstico: por que
- Preditivo: O que vai acontecer
- Prescritivo: O que devo fazer
Site: Datascience.pizza / Kaggle.com
- PAsssos para ser um CD
- Matemática e estatistiva
- Negócios
- Linguagens de programação
- Técnicas de apresentação
- Pratique
- Quais as 3 habilidades básicas que definem o perfil do Cientista de Dados? Discuta um caso se acontecer apenas 2 destas habilidades.
- Hacking + Business + Matemática e Estatística. Hack + Busin = perigo, fraude?
- 3 ferramentas para o CD:
- Python, R e Java
- Deep learning?
- Afeta a eficiência do Python?
- Quanto custa o tempo de processamento x tempo do programador? Prog mais barato
- Como resolver a questão da ineficiência do Python se podemos lidar com petabytes de dados?
- Usando rotinas ou módulos em Java ou C para melhorar a eficiência
- Qual a função do Hadoop?
- Distribuir
- E do MapReduce?
- Mapear os dados armazenados e consolidar estes dados com um objetivo final
- Exemplo de resultado tangível. Case da empresa
- Exemplo de Deep learning
- Chinês localizado frente a milhares de pessoas baseado no reconhecimento de imagem, Bigdata e STT
- 1. Descreva um exemplo prático gerado pelos resultados de um Cientista de Dados.
- 2. O que é deep learning?
- Ramo do Machine Learning baseado em um conjunto de algoritmos que promovem abstrações de alto nível em dados usando um grafo de profundidade com múltiplas camadas de processamento compostas de múltiplas transformações não-lineares
- 3. Defina "“full stack engineer”
- Alguém que domina todo o processo de ciência de dados
- 4. Destaque 3 tecnologias que fazem parte do BigData.
- Hadoop, MapReduce e NoSQL
- 5. O que é Data Mining?
- Mineração de Dados
Descrição Cientistas de Dados
O cientista de dados, nome dado ao profissional desta área, vive em três mundos: o dos negócios, o da matemática e o de TI. Sua função é transformar os dados disponíveis em balizadores de decisões a serem tomadas.
Esse processo de trabalho com dados exige que este profissional tenha qualificações na área de TI para que consiga acessar e processar o dado de forma eficiente e em tempo hábil, capacidades matemáticas para entender as implicações dos modelos utilizados e de negócio para que possa traduzir tudo isso em relatórios que possibilitem decisões assertivas.
Funções Típicas dos cientistas de dados
• Coletar grandes quantidades de dados “unruly” ou desafiadores e transformá-los em um formato mais prático;
• Solucionar problemas de negócios com técnicas de orientação à dados;
• Trabalhar com uma variedade de linguagens de programação, incluindo SAS, R e Python;
• Ter uma sólida compreensão de estatísticas, incluindo testes estatísticos e distribuições;
• Manter-se a par das técnicas analíticas, como a aprendizagem de máquinas, ou machine learning, a aprendizagem profunda, ou deep learning e análise de dados textuais, ou text analytics;
• Comunicar-se e colaborar com TI e área de negócios;
• Procurar por ordens e padrões nos dados, bem como detectar tendências que podem ajudar os resultados de uma empresa;
Como se tornar um cientista de dados
Escolher uma universidade que ofereça um diploma em ciência de dados, ou pelo menos, uma que ofereça aulas de ciência de dados e analytics é um primeiro passo importante. É importante também que tenham um talento especial para a resolução de problemas, a capacidade de comunicação e uma curiosidade insaciável sobre como as coisas funcionam.Além dessas qualidades, você também precisará de um sólido conhecimento em:
Estatística e machine learning; Linguagens de codificação, como SAS, R ou Python; Bancos de dados como MySQL e Postgres; Visualização de dados e tecnologias de informação; Hadoop e MapReduce;
Mercado de Trabalho
A escassez deste profissional se reflete nos salários. Ao longo de toda a carreira, os cientistas de dados têm remuneração superior à dos técnicos, que até o surgimento do big data eram os responsáveis por cuidar da manutenção dos bancos de dados.
No Brasil, um profissional recém-formado pode ganhar até 6 000 reais, enquanto os gerentes chegam a receber cerca de 20 000 reais. Segundo a empresa de recolocação americana Glassdoor, os profissionais do big data também são valorizados nos Estados Unidos. Lá, o ganho médio de um cientista de dados em início de carreira é de 10 000 dólares mensais, o dobro do de um programador.
Referências Bibliográficas