Hudsola (discussão | contribs)
Hudsola (discussão | contribs)
Linha 32: Linha 32:


= Ética profissional =
= Ética profissional =
- Apontar qualquer situação em que é necessário ética. Seja alguma situação vivida pelo profissional ou que ele tenha tido conhecimento. Importante ressaltar o comportamento adequado do profissional dentro de uma empresa ou de um negócio.
No contrato de um Cientista de dados, geralmente, possui uma parte especifica sobre a ética da empresa, sigilo e uma multa caso o profissional exponha os dados propositalmente. No geral, caso um cientista de dados perceba algo de diferente e incomum na analise de dados, ele deve comunicar o gestor. Caso um Cientista de dados descumpra essa ética, dificilmente ele conseguirá um novo emprego nessa área.  
- Caso o profissional não sugira nada, a equipe deverá pesquisar e discutir algum caso
- Os casos, tanto podem tratar de comportamentos éticos positivos quanto de situações onde a ética tenha sido desvirtuada.
<br>
<br>



Edição das 19h31min de 21 de outubro de 2021

Evolução na profissão

Tiago Kerr, 26 anos, foi um estudante de Estatística na UFU antes de se tornar um Cientista de Dados. Através de pesquisas de estatísticas de dados que conheceram a Ciência de dados. teve iniciação cientifica em estatística multivariaveis que é muito similar a Machine Learning, o que lhe deu acesso aos principais algoritmos. Após a iniciação cientifica, começou a prestar consultoria para pós graduação e sempre utilizando algoritmos de Ciência de dados. Com essa experiência, passou por diversas empresas até chegar nos dias de hoje onde atua aplicando Ciência de dados em redes sociais pela Brivia.

Descrição da atividade atual

A empresa trás uma certa demanda e o Cientista de Dados é responsável por, através de analise do banco de dados, identificar o que é mais e menos relevante/impactante para tal demanda, ou seja, transformar dados em informação de valor para a empresa. Através de metodologia chamada CRISP-DM que é: Business Understanding > Data Understanding > Data Preparation > Modeling > Evaluation > Deployment > DATA. (Sempre acompanhado de especialistas de determinada área)

Requisitos mínimos para exercer a profissão

Data Scientist (cientista de dados) é abordada em graduação de Ciência da Computação, Estatística, Sistemas de Informação e outros derivados da Tecnologia. E também, existem diversos cursos e livros sobre Ciência de dados que ensinam algoritmos que podem ser utilizados, porém existe diversos algoritmos e diversas situações que requer certo tipo de algoritmo. Recomenda-se conhecer mais sobre Data Science, desenvolver habilidades de programação (se especializar em uma linguagem primeiro), aprofundar em conceitos básicos de estatística/matemática, aprender a usar a linguagem de programação para manipulação de dados, fazer analises exploratórias e descritivas (como gráficos e relatórios), aprender sobre o conceito de aprendizado da maquina e ver modelos e algoritmos, aprender linguagem de banco de dados e por fim desenvolver o primeiro projeto.

Ferramentas usadas no dia-a-dia

Usa-se bastante ferramentas para divresas funções como Data Plataform & Ingestion Tools (Spark), Development Tools (Visual Studio), Linguagem de Programação (Java, R, Python), Deep Learning Tools (Open Neural Network Exchange), ML & AI Tools ( Microsoft ML), Data Exploration & Visualization (SQL server).

Tecnologias envolvidas

Conhecimento técnico e científico aplicado na atividade profissional utilizando ferramentas, processos e recursos físicos. Neste caso, escolher uma tecnologia e aprofundar a ponto de poder discutir em sala de aula Exemplos:

  • SO, Banco de Dados, Linguagens, Metodologia ágil para o Engenheiro de Software
  • Redes de Computadores, Roteamento, sistemas de comunicação e comutação para o Analista de Redes
  • Criptografia, Certificação Digital, Banco de Dados, Ambiente Web para Analistas de Segurança
  • Banco de Dados, Normalização, Tuning, redundância para o DBA
  • E assim por diante ....


Pesquisar
Deep Learning

Ética profissional

No contrato de um Cientista de dados, geralmente, possui uma parte especifica sobre a ética da empresa, sigilo e uma multa caso o profissional exponha os dados propositalmente. No geral, caso um cientista de dados perceba algo de diferente e incomum na analise de dados, ele deve comunicar o gestor. Caso um Cientista de dados descumpra essa ética, dificilmente ele conseguirá um novo emprego nessa área.

Exemplo de resultado tangível

Uma empresa tem muitos fornecedores e baseado em dados, (geografia, característica do cliente, do fornecedor, etc) dos últimos 4 anos e através desse conjunto de variáveis e um modelo aplicado, definiram qual fornecedor é o que menos atrasaria uma entrega em determinada situação.

Upload da apresentação

https://www.youtube.com/watch?v=VwfY-5Zw9FY


Dúvidas


  • 01. [Luiz Cláudio] O que são Dashboards? Para que servem? Cite um exemplo de Tomada de Decisão baseado num deles
    • Um dashboard é uma ferramenta de gestão da informação que ajuda no acompanhamento e exibição de indicadores chave de performance (KPIs), métricas e dados que indicam a saúde de um negócio, setor ou processo. Por meio de um Dashboard a empresa Callink define o perfil de desempenho de um certo funcionário.


  • 02. [Luiz Cláudio] Como funciona o ETL? Dê um exemplo de utilização prático.
    • ETL é um tipo de data integration em três etapas (extração, transformação, carregamento) usado para combinar dados de diversas fontes. Nesse processo, os dados são retirados (extraídos) de um sistema-fonte, convertidos (transformados) em um formato que possa ser analisado, e armazenados (carregados) em um armazém ou outro sistema.

Como exemplo, podemos considerar um Banco de dados de Clientes Especiais com todas as informações essenciais. O processo de limpeza removerá erros e padronizará as informações. O processo de complementação implicará no acréscimo de dados.

  • 03. [Luiz Cláudio] O que é DataLake?
    • O data lake é um tipo de repositório que armazena conjuntos grandes e variados de dados brutos em formato nativo. Com os data lakes, você tem uma visão não refinada dos dados.


  • 04. [Luiz Cláudio] Qual a vantagem da empresa em usar um BigData?
    • Mais precisão para a tomada de decisões
  •Diagnósticos cada vez mais completos
  •Maior volume de dados armazenados.


  • 05. [Luiz Cláudio] O que é uma Análise Exploratória?
    • É examinar os dados previamente à aplicação de qualquer técnica estatística. Desta forma o analista consegue um entendimento básico de seus dados e das relações existentes entre as variáveis analisadas.


  • 06. [Luiz Cláudio] Explique Clusterização e sua função nos desafios de uma atividade de Ciência de Dados.


  • 07. [Luiz Cláudio] Qual a competência (responsabilidade) de um Engenheiro de Dados?


  • 08. [Luiz Cláudio] Cite alguns algoritmos considerados como básicos para o iniciante.


  • 09. [Luiz Cláudio] Vocês lidam com Banco de Dados NoSQL? Qual ou quais?


  • 10. [Davy Bittencourt Lima] Vcs tem algum papel em casos de vazamentos de dados?
    • O papel do Cientista de dados é comunicar seu gestor qualquer tipo de anomalia.