Sem resumo de edição
Etiqueta: visualeditor
Etiqueta: visualeditor
Linha 10: Linha 10:
=== Tipos de informação  ===
=== Tipos de informação  ===
Segue alguns tipos e técnicas de Mineração de Dados que se é possível obter informações:
Segue alguns tipos e técnicas de Mineração de Dados que se é possível obter informações:
* '''Associações''': Dados que trazem quais produtos são mais prováveis de serem vendidos juntos, gerando recomendações para os clientes. São ocorrências ligadas a um único evento, no caso, a primeira compra.
* '''Associações:''' Dados que trazem quais produtos são mais prováveis de serem vendidos juntos, gerando recomendações para os clientes. São ocorrências ligadas a um único evento, no caso, a primeira compra.


* '''Sequências:''' São eventos que estão ligados ao longo do tempo. Como exemplo, o que um usuário faz após o primeiro login em uma rede social.
* '''Sequências:''' São eventos que estão ligados ao longo do tempo. Como exemplo, o que um usuário faz após o primeiro login em uma rede social.


* '''Classificação:''' Reconhece um grupo que um item pertence através da análise dos itens já classificados anteriormente usando-se um conjunto de regras.  
* '''Classificação:''' Reconhece a qual grupo um item pertence através da análise dos itens já classificados anteriormente usando-se um conjunto de regras.  
* '''Regressão:''' Compreende a busca por uma função que mapeie os registros de um banco de dados em um intervalo de valores numéricos reais. Esta tarefa é similar à tarefa de Classificação, com a diferença de que o atributo alvo assume valores numéricos.
* '''Regressão:''' É uma função que mapeia os registros de um banco de dados em um intervalo de valores em numéricos reais.
* '''Previsão de Séries Temporais:''' Uma série temporal é um conjunto de observações de um fenômeno (variável numérica) ordenadas no tempo. Exemplos de séries temporais: o consumo mensal de energia elétrica de uma casa, registrado durante um ano ou as vendas diárias de um produto no decorrer de um mês, dentre muitos outros. A previsão de uma série temporal tem como objetivo inferir valores que a variável da série deverá assumir no futuro considerando como base valores passados dessa série.
* '''Previsão de Séries Temporais:''' Uma série temporal é um conjunto de registros de um fenômeno que é organizado em ordem temporal, como hora,minuto,dia,mês,ano. Como exemplo, registro de eventos no decorrer de um mês podendo ser o quanto foi gasto no mês de energia que é um conjunto mensal ou a quantidade de vezes em que o usuário realizou um login em uma rede social em 1 dia e gerar dados a partir disto.


* '''Aglomeração:''' Funciona de maneira semelhante a classificação quando ainda não foram definidos grupos. Uma ferramenta de data mining descobrirá diferentes agrupamentos dentro da massa de dados. Por exemplo ao encontrar grupos de afinidades para cartões bancários ou ao dividir o banco de dados em categorias de clientes com base na demografia e em investimentos pessoais.
* '''Aglomeração:''' Funciona de maneira semelhante a classificação porém trabalha com grupos indefinidos.


* '''Prognóstico:''' Embora todas essas aplicações envolvam previsões, os prognósticos as utilizam de modo diferente. Partem de uma série de valores existentes para prever quais serão os outros valores. Por exemplo um prognóstico pode descobrir padrões nos dados que ajudam os gerentes a estimar o valor futuro de variáveis com números de vendas.
* '''Prognóstico:''' Prognóstico partem de uma série de valores existentes para prever quais serão os próximos valores. Por exemplo um prognóstico pode descobrir padrões nos dados que ajudam os gerentes a estimar sobre o números de vendas e também uma receita aproximada.


Lembrando que todos esses tipos e técnicas de Mineração de Dados que cito acima ele é adaptado em vários outros segmentos e não apenas comercial, fazendo exemplos usando o mercado para facilitar a compreensão, não há um limite de como se fazer a mineração, toda a mineração é realizada através de uma pesquisa de um banco de dados, que segue uma lógica usando linhas de comandos.  
Lembrando que todos esses tipos e técnicas de Mineração de Dados que cito acima ele é adaptado em vários outros segmentos e não apenas comercial, fazendo exemplos usando o mercado para facilitar a compreensão, não há um limite de como se fazer a mineração, toda a mineração é realizada através de uma pesquisa de um banco de dados, que segue uma lógica usando linhas de comandos.  
Linha 34: Linha 34:
'''Energia'''
'''Energia'''


Em um cenário onde se está em época de poucas chuvas, é preciso aplicar técnicas de Mineração de Dados para a geração de modelos e relatórios que façam a previsão de demanda de consumo de energia elétrica por regiões, então os tipos de dados que estamos tentando minerar é tarefa de Regressão/Previsão de Séries Temporais). Para se obter estes dados foram utilizados registros de consumo de energia elétrica ao longo de períodos anteriores.
Em um cenário onde se está em época de poucas chuvas, é preciso aplicar técnicas de Mineração de Dados para a geração de modelos e relatórios que façam a previsão de demanda de consumo de energia elétrica por regiões, então os tipos de dados que estamos trabalhando e tentando minerar é Regressão e Previsão de Séries Temporais. Para se obter estes dados foram utilizados registros de consumo de energia elétrica ao longo de períodos anteriores.
 
'''Medicina'''
 
Um projeto de Data Mining foi realizado na área de Citopatologia para extrair conhecimento que auxiliasse na detecção e na prevenção de câncer de colo de útero. A base de dados analisada continha informações sobre diversas pacientes de vários municípios do Rio Grande do Sul, incluindo imagens das amostras de material (células) coletado para exame citopatológico. Considerando o grande volume de amostras a ser analisado, o projeto teve como objetivo construir um modelo de classificação que permitisse auxiliar no diagnóstico da doença a partir das imagens e dos dados das amostras coletadas em novas pacientes (tarefa de Classificação).


== Referências Bibliográficas ==
== Referências Bibliográficas ==
Links:
Links:
* [https://pt.wikipedia.org/wiki/Minera%C3%A7%C3%A3o_de_dados [1] Mineração de Dados - Wikipedia]
* [https://pt.wikipedia.org/wiki/Minera%C3%A7%C3%A3o_de_dados <nowiki>[1] Mineração de Dados - Wikipedia]</nowiki>]
* [http://www.sas.com/pt_br/insights/analytics/mineracao-de-dados.html [2]] Mineração de Dados, O que é e por que é importante? - SAS
* [http://www.sas.com/pt_br/insights/analytics/mineracao-de-dados.html [2] Mineração de Dados, O que é e por que é importante? - SAS]
* [http://computerworld.com.br/exemplos-de-aplicacoes-de-data-mining-no-mercado-brasileiro <nowiki>[3]</nowiki>] [http://computerworld.com.br/exemplos-de-aplicacoes-de-data-mining-no-mercado-brasileiro Exemplos de aplicações de data mining no mercado brasileiro - Ronaldo Goldschmidt e Eduardo Bezerra]
* [http://computerworld.com.br/exemplos-de-aplicacoes-de-data-mining-no-mercado-brasileiro <nowiki>[3]</nowiki>] [http://computerworld.com.br/exemplos-de-aplicacoes-de-data-mining-no-mercado-brasileiro Exemplos de aplicações de data mining no mercado brasileiro - Ronaldo Goldschmidt e Eduardo Bezerra]
* [https://msdn.microsoft.com/pt-br/library/ms174949.aspx <nowiki>[4] Conceitos de mineração de dados - Microsoft Developer Network]</nowiki>]
* [https://msdn.microsoft.com/pt-br/library/ms174949.aspx <nowiki>[4] Conceitos de mineração de dados - Microsoft Developer Network]</nowiki>]

Edição das 21h40min de 7 de setembro de 2016

Conceito

    Mineração de Dados ou Data Mining em inglês, é um processo de procura, devido ao grande volume de informações que um banco de dados possui, a realização da análise desses dados por seres humanos é inviável sem o auxílio de ferramentas computacionais apropriadas, o profissional que trabalhar em Mineração de Dados minera então dados de relevância, que tenham correlações entre outros dados, utiliza-se várias técnicas da estatística, recuperação de informação, inteligência artificial e reconhecimento de padrões.

    Este conceito de Mineração de Dados então é utilizado em vários segmentos da indústria e órgãos governamentais para trazer vários tipos de informação dependendo a partir de qual banco de dados está se fazendo a Mineração de Dados, utilizando este conceito é possível e praticamente um requisito obrigatório para melhorar a gestão de um negócio, obtendo conhecimento através dos dados retornados através da mineração.

    Não confunda Mineração de Dados com Business Intelligence (BI), eles são dois patamares distintos de atuação. O BI tem como função de prover a empresa com conhecimento novo e útil acerca do seu negócio e funciona no plano estratégico. A Mineração de Dados procura obter a partir dos dados brutos, informação útil para prover uma tomada de decisão nos médios e altos níveis da empresa, tendo muita influência no plano tático.

    Para compreender a importância da Mineração de Dados, há muita informação disponível pela internet e banco de dados mas isto não quer dizer necessariamente mais conhecimento, é preciso entender o que é relevante e, então, fazer bom uso dessa informação de acordo com alguns tipos de dados, ela deve ser estruturada de maneira lógica e inteligente.

Tipos de informação

Segue alguns tipos e técnicas de Mineração de Dados que se é possível obter informações:

  • Associações: Dados que trazem quais produtos são mais prováveis de serem vendidos juntos, gerando recomendações para os clientes. São ocorrências ligadas a um único evento, no caso, a primeira compra.
  • Sequências: São eventos que estão ligados ao longo do tempo. Como exemplo, o que um usuário faz após o primeiro login em uma rede social.
  • Classificação: Reconhece a qual grupo um item pertence através da análise dos itens já classificados anteriormente usando-se um conjunto de regras.
  • Regressão: É uma função que mapeia os registros de um banco de dados em um intervalo de valores em numéricos reais.
  • Previsão de Séries Temporais: Uma série temporal é um conjunto de registros de um fenômeno que é organizado em ordem temporal, como hora,minuto,dia,mês,ano. Como exemplo, registro de eventos no decorrer de um mês podendo ser o quanto foi gasto no mês de energia que é um conjunto mensal ou a quantidade de vezes em que o usuário realizou um login em uma rede social em 1 dia e gerar dados a partir disto.
  • Aglomeração: Funciona de maneira semelhante a classificação porém trabalha com grupos indefinidos.
  • Prognóstico: Prognóstico partem de uma série de valores existentes para prever quais serão os próximos valores. Por exemplo um prognóstico pode descobrir padrões nos dados que ajudam os gerentes a estimar sobre o números de vendas e também uma receita aproximada.

Lembrando que todos esses tipos e técnicas de Mineração de Dados que cito acima ele é adaptado em vários outros segmentos e não apenas comercial, fazendo exemplos usando o mercado para facilitar a compreensão, não há um limite de como se fazer a mineração, toda a mineração é realizada através de uma pesquisa de um banco de dados, que segue uma lógica usando linhas de comandos.

Exemplos

Comércio

    Suponhamos que em um supermercado acontece a seguinte situação:

A maioria dos clientes que adquiriram pão e leite desnatado
também adquiriram manteiga ou margarina.

Só é possível descobrir a incidência destes casos apenas com uma Mineração de Dados, com isso foi possível então constatar um padrão de compras entre a maior parte dos clientes e com esta informação o supermercado pode tomar ações para atender mais este tipo de demanda colocando mais a disposição nas prateleiras do supermercado certos produtos que tem um padrão de compras para incentivar ainda mais este hábito.

Energia

Em um cenário onde se está em época de poucas chuvas, é preciso aplicar técnicas de Mineração de Dados para a geração de modelos e relatórios que façam a previsão de demanda de consumo de energia elétrica por regiões, então os tipos de dados que estamos trabalhando e tentando minerar é Regressão e Previsão de Séries Temporais. Para se obter estes dados foram utilizados registros de consumo de energia elétrica ao longo de períodos anteriores.

Medicina

Um projeto de Data Mining foi realizado na área de Citopatologia para extrair conhecimento que auxiliasse na detecção e na prevenção de câncer de colo de útero. A base de dados analisada continha informações sobre diversas pacientes de vários municípios do Rio Grande do Sul, incluindo imagens das amostras de material (células) coletado para exame citopatológico. Considerando o grande volume de amostras a ser analisado, o projeto teve como objetivo construir um modelo de classificação que permitisse auxiliar no diagnóstico da doença a partir das imagens e dos dados das amostras coletadas em novas pacientes (tarefa de Classificação).

Referências Bibliográficas

Links: