Sem resumo de edição |
|||
| Linha 36: | Linha 36: | ||
* 01. O que é Análise Estatística? De que forma ela pode ajudar o Cientista de Dados? | * 01. O que é Análise Estatística? De que forma ela pode ajudar o Cientista de Dados? | ||
** | ** Análise Estatística é a ciência de coletar, explorar e apresentar dados para encontrar padrões escondidos e tendências. O conhecimento em Matemática faz parte do pacote essencial para quem pretende trabalhar como Cientista de Dados. Modelos estatísticos e algoritmos de Machine Learning, dependem de conhecimentos em Estatística. | ||
<br> | <br> | ||
* 02. Machine Learning: Explique a interação entre entradas, saídas e regras. Dê um exemplo. | * 02. Machine Learning: Explique a interação entre entradas, saídas e regras. Dê um exemplo. | ||
** | ** Em Machine Learning, os dados de entrada e resultados desejados são fornecidos e o algoritmo se encarrega de encontrar relações estatísticas dentro desse "banco de dados" para encontrar as entradas para os resultados desejados, ou seja, eles “aprendem” com o passar do tempo e com o acúmulo de “experiência”. | ||
Um exemplo de Machine Learning é a recomendação de produtos nas propagandas pela internet, oferecendo aos clientes, itens com base naquilo que eles estão comprando. | |||
<br> | <br> | ||
* 03. Quais as 3 habilidades básicas que definem o perfil do Cientista de Dados? Discuta um caso se acontecer apenas 2 destas habilidades. | * 03. Quais as 3 habilidades básicas que definem o perfil do Cientista de Dados? Discuta um caso se acontecer apenas 2 destas habilidades. | ||
** | ** Um cientista de dados deve dominar, pelo menos parcialmente, 3 áreas de conhecimento que são chamadas de Hacking, Matemática e Estatística; e, Negócios. Caso aconteça apenas Hacking e Negócios , é possível que o profissional possa usar de suas habilidades em Hacking para lucrar de forma ilegal, eles se tornaram os chamados "Black Hat Hackers". | ||
<br> | <br> | ||
* 04. O que é Analytics? Descreva um resultado fornecido por essa prática. | * 04. O que é Analytics? Descreva um resultado fornecido por essa prática. | ||
** | ** Analytics, refere-se à possibilidade de se utilizar dados, análises e raciocínio sistemático para seguir em um processo de tomada de decisão muito mais eficiente. Com isso, é possível, por exemplo, uma empresa prever a probabilidade de seus clientes desistirem do plano de tv a cabo, e assim, recapturá-los por meio de ofertas. | ||
<br> | <br> | ||
* 05. Cite, no mínimo, 3 ferramentas usadas por um Cientista de Dados. | * 05. Cite, no mínimo, 3 ferramentas usadas por um Cientista de Dados. | ||
** | ** R, Python, SQL, Java. | ||
<br> | <br> | ||
* 06. Como resolver a questão da ineficiência do Python se podemos lidar com petabytes de dados? | * 06. Como resolver a questão da ineficiência do Python se podemos lidar com petabytes de dados? | ||
** | ** Apesar de Python ser uma linguagem simples de se codificar, ela é interpretada, o que causa ineficiência para uma grande quantidade de dados como petabytes, por isso, geralmente se utiliza Java para superar esse problema. | ||
<br> | <br> | ||
Edição das 17h59min de 26 de junho de 2018
Evolução na profissão
- Quais as atividades, responsabilidades ou demandas assumidas por esse profissional.
Descrição da atividade atual
- O que este profissional faz no seu dia-a-dia. Em que ele trabalha ou em que processos ele atua. Se faz reuniões periódicas, se testa, se codfica, se avalia sistemas, se pesquisa ou coisas do gênero.
Requisitos mínimos para exercer a profissão
- O que se deve estudar, aprender, aprofundar ou dominar no nível básico para iniciar carreira nessa profissão.
Ferramentas usadas no dia-a-dia
- Softwares, Frameworks, tools ou plataformas utilizadas pelo profissional para cumprir suas tarefas.
Tecnologias envolvidas
- Descrição de tecnologias que o profissional lida direta ou indiretamente.
Ética profissional
- Descrição de casos reais (sem citar nomes de empresas ou pessoas) onde a ética profissional foi aplicada (ou a falta dela).
Exemplo de resultado tangível
- Exemplo de um produto, processo ou serviço concluído pelo profissional, que entrou no mercado, ou a empresa adotou ou que é usado por algumas pessoas ou empresas.
Upload da apresentação
- Utilize o ícone (Arquivo Embutido), ao lado do A maiúsculo para inserir a apresentação.
Dúvidas
- 01. O que é Análise Estatística? De que forma ela pode ajudar o Cientista de Dados?
- Análise Estatística é a ciência de coletar, explorar e apresentar dados para encontrar padrões escondidos e tendências. O conhecimento em Matemática faz parte do pacote essencial para quem pretende trabalhar como Cientista de Dados. Modelos estatísticos e algoritmos de Machine Learning, dependem de conhecimentos em Estatística.
- 02. Machine Learning: Explique a interação entre entradas, saídas e regras. Dê um exemplo.
- Em Machine Learning, os dados de entrada e resultados desejados são fornecidos e o algoritmo se encarrega de encontrar relações estatísticas dentro desse "banco de dados" para encontrar as entradas para os resultados desejados, ou seja, eles “aprendem” com o passar do tempo e com o acúmulo de “experiência”.
Um exemplo de Machine Learning é a recomendação de produtos nas propagandas pela internet, oferecendo aos clientes, itens com base naquilo que eles estão comprando.
- 03. Quais as 3 habilidades básicas que definem o perfil do Cientista de Dados? Discuta um caso se acontecer apenas 2 destas habilidades.
- Um cientista de dados deve dominar, pelo menos parcialmente, 3 áreas de conhecimento que são chamadas de Hacking, Matemática e Estatística; e, Negócios. Caso aconteça apenas Hacking e Negócios , é possível que o profissional possa usar de suas habilidades em Hacking para lucrar de forma ilegal, eles se tornaram os chamados "Black Hat Hackers".
- 04. O que é Analytics? Descreva um resultado fornecido por essa prática.
- Analytics, refere-se à possibilidade de se utilizar dados, análises e raciocínio sistemático para seguir em um processo de tomada de decisão muito mais eficiente. Com isso, é possível, por exemplo, uma empresa prever a probabilidade de seus clientes desistirem do plano de tv a cabo, e assim, recapturá-los por meio de ofertas.
- 05. Cite, no mínimo, 3 ferramentas usadas por um Cientista de Dados.
- R, Python, SQL, Java.
- 06. Como resolver a questão da ineficiência do Python se podemos lidar com petabytes de dados?
- Apesar de Python ser uma linguagem simples de se codificar, ela é interpretada, o que causa ineficiência para uma grande quantidade de dados como petabytes, por isso, geralmente se utiliza Java para superar esse problema.