Sem resumo de edição
Linha 36: Linha 36:


* 01. O que é Análise Estatística? De que forma ela pode ajudar o Cientista de Dados?
* 01. O que é Análise Estatística? De que forma ela pode ajudar o Cientista de Dados?
**
** Análise Estatística é a ciência de coletar, explorar e apresentar dados para encontrar padrões escondidos e tendências. O conhecimento em Matemática faz parte do pacote essencial para quem pretende trabalhar como Cientista de Dados. Modelos estatísticos e algoritmos de Machine Learning, dependem de conhecimentos em Estatística.
 
<br>
<br>


* 02. Machine Learning: Explique a interação entre entradas, saídas e regras. Dê um exemplo.
* 02. Machine Learning: Explique a interação entre entradas, saídas e regras. Dê um exemplo.
**
** Em Machine Learning, os dados de entrada e resultados desejados são fornecidos e o algoritmo se encarrega de encontrar relações estatísticas dentro desse "banco de dados" para encontrar as entradas para os resultados desejados, ou seja, eles “aprendem” com o passar do tempo e com o acúmulo de “experiência”.
Um exemplo de Machine Learning é a recomendação de produtos nas propagandas pela internet, oferecendo aos clientes, itens com base naquilo que eles estão comprando.
<br>
<br>


* 03. Quais as 3 habilidades básicas que definem o perfil do Cientista de Dados? Discuta um caso se acontecer apenas 2 destas habilidades.
* 03. Quais as 3 habilidades básicas que definem o perfil do Cientista de Dados? Discuta um caso se acontecer apenas 2 destas habilidades.
**
** Um cientista de dados deve dominar, pelo menos parcialmente, 3 áreas de conhecimento que são chamadas de Hacking, Matemática e Estatística; e, Negócios. Caso aconteça apenas Hacking e Negócios , é  possível que o profissional possa usar de suas habilidades em Hacking para lucrar de forma ilegal, eles se tornaram os chamados "Black Hat Hackers".
<br>
<br>


* 04. O que é Analytics? Descreva um resultado fornecido por essa prática.
* 04. O que é Analytics? Descreva um resultado fornecido por essa prática.
**
** Analytics, refere-se à possibilidade de se utilizar dados, análises e raciocínio sistemático para seguir em um processo de tomada de decisão muito mais eficiente. Com isso, é possível, por exemplo, uma empresa prever a probabilidade de seus clientes desistirem do plano de tv a cabo, e assim, recapturá-los por meio de ofertas.
<br>
<br>


* 05. Cite, no mínimo, 3  ferramentas usadas por um Cientista de Dados.
* 05. Cite, no mínimo, 3  ferramentas usadas por um Cientista de Dados.
**
** R, Python, SQL, Java.
<br>
<br>


* 06. Como resolver a questão da ineficiência do Python se podemos lidar com petabytes de dados?
* 06. Como resolver a questão da ineficiência do Python se podemos lidar com petabytes de dados?
**  
** Apesar de Python ser uma linguagem simples de se codificar, ela é interpretada, o que causa ineficiência para uma grande quantidade de dados como petabytes, por isso, geralmente se utiliza Java para superar esse problema.
 
<br>
<br>

Edição das 17h59min de 26 de junho de 2018

Evolução na profissão

  • Quais as atividades, responsabilidades ou demandas assumidas por esse profissional.


Descrição da atividade atual

  • O que este profissional faz no seu dia-a-dia. Em que ele trabalha ou em que processos ele atua. Se faz reuniões periódicas, se testa, se codfica, se avalia sistemas, se pesquisa ou coisas do gênero.


Requisitos mínimos para exercer a profissão

  • O que se deve estudar, aprender, aprofundar ou dominar no nível básico para iniciar carreira nessa profissão.


Ferramentas usadas no dia-a-dia

    • Softwares, Frameworks, tools ou plataformas utilizadas pelo profissional para cumprir suas tarefas.


Tecnologias envolvidas

  • Descrição de tecnologias que o profissional lida direta ou indiretamente.


Ética profissional

    • Descrição de casos reais (sem citar nomes de empresas ou pessoas) onde a ética profissional foi aplicada (ou a falta dela).


Exemplo de resultado tangível

  • Exemplo de um produto, processo ou serviço concluído pelo profissional, que entrou no mercado, ou a empresa adotou ou que é usado por algumas pessoas ou empresas.


Upload da apresentação

  • Utilize o ícone (Arquivo Embutido), ao lado do A maiúsculo para inserir a apresentação.



Dúvidas


  • 01. O que é Análise Estatística? De que forma ela pode ajudar o Cientista de Dados?
    • Análise Estatística é a ciência de coletar, explorar e apresentar dados para encontrar padrões escondidos e tendências. O conhecimento em Matemática faz parte do pacote essencial para quem pretende trabalhar como Cientista de Dados. Modelos estatísticos e algoritmos de Machine Learning, dependem de conhecimentos em Estatística.


  • 02. Machine Learning: Explique a interação entre entradas, saídas e regras. Dê um exemplo.
    • Em Machine Learning, os dados de entrada e resultados desejados são fornecidos e o algoritmo se encarrega de encontrar relações estatísticas dentro desse "banco de dados" para encontrar as entradas para os resultados desejados, ou seja, eles “aprendem” com o passar do tempo e com o acúmulo de “experiência”.
	Um exemplo de Machine Learning é a recomendação de produtos nas propagandas pela internet, oferecendo aos clientes, itens com base naquilo que eles estão comprando.


  • 03. Quais as 3 habilidades básicas que definem o perfil do Cientista de Dados? Discuta um caso se acontecer apenas 2 destas habilidades.
    • Um cientista de dados deve dominar, pelo menos parcialmente, 3 áreas de conhecimento que são chamadas de Hacking, Matemática e Estatística; e, Negócios. Caso aconteça apenas Hacking e Negócios , é possível que o profissional possa usar de suas habilidades em Hacking para lucrar de forma ilegal, eles se tornaram os chamados "Black Hat Hackers".


  • 04. O que é Analytics? Descreva um resultado fornecido por essa prática.
    • Analytics, refere-se à possibilidade de se utilizar dados, análises e raciocínio sistemático para seguir em um processo de tomada de decisão muito mais eficiente. Com isso, é possível, por exemplo, uma empresa prever a probabilidade de seus clientes desistirem do plano de tv a cabo, e assim, recapturá-los por meio de ofertas.


  • 05. Cite, no mínimo, 3 ferramentas usadas por um Cientista de Dados.
    • R, Python, SQL, Java.


  • 06. Como resolver a questão da ineficiência do Python se podemos lidar com petabytes de dados?
    • Apesar de Python ser uma linguagem simples de se codificar, ela é interpretada, o que causa ineficiência para uma grande quantidade de dados como petabytes, por isso, geralmente se utiliza Java para superar esse problema.