Etiqueta: visualeditor
Vitor085 (discussão | contribs)
Sem resumo de edição
 
(3 revisões intermediárias por 3 usuários não estão sendo mostradas)
Linha 1: Linha 1:
== Conceito ==
1 Conceito
    Mineração de Dados ou Data Mining em inglês, é um processo de procura, devido ao grande volume de informações que um banco de dados pode possuir, a realização da análise desses dados por seres humanos é inviável sem o auxílio de ferramentas computacionais apropriadas, o profissional que trabalhar em Mineração de Dados minera então dados de relevância, que tenham correlações entre outros dados, utiliza-se várias técnicas da estatística, recuperação de informação, inteligência artificial e reconhecimento de padrões.


    Este conceito de Mineração de Dados então é utilizado em qualquer ambiente em que se tenha um banco de dados para trazer vários tipos de informação dependendo a partir de qual banco de dados está se fazendo a Mineração de Dados, é praticamente um requisito obrigatório em qualquer ambiente que precise da análise das informações contidas a partir de seu banco de dados, com mineração então se obtém conhecimento através da análise dos dados que são retornados através da mineração.
A mineração de dados é o processo de descoberta de informações acionáveis em grandes conjuntos de dados. A mineração de dados usa análise matemática para derivar padrões e tendências que existem nos dados. Normalmente, esses padrões não podem ser descobertos com a exploração de dados tradicional pelo fato de as relações serem muito complexas ou por haver muitos dados.


    Não confunda Mineração de Dados com Business Intelligence (BI), eles são dois tipos distintos de atuação. O BI tem como função de prover a empresa com conhecimento novo e útil acerca do seu negócio e funciona no plano estratégico. A Mineração de Dados procura obter a partir dos dados brutos, informação útil para prover uma tomada de decisão nos médios e altos níveis da empresa, tendo muita influência no plano tático.
1.1 Tipos de informação


    Para compreender a importância da Mineração de Dados, há muita informação disponível pela internet e em banco de dados porém isto não quer dizer necessariamente mais conhecimento, é preciso entender o que é relevante, trabalhar estes dados e, então, fazer bom uso dessa informação de acordo com alguns tipos de dados, ela deve ser estruturada de maneira lógica e inteligente.
'''Associações:''' São ocorrências ligadas a um único evento. Por exemplo:um estudos de modelos de compra em supermercados pode revelar que, na compra de salgadinhos de milho, compra-se também um refrigerante tipo cola em 65% das vezes: mas, quando uma promoção, o refrigerante é comprado em 85% das vezes.Com essas informações, os gerentes podem tomar decisões mais acertadas pois aprenderam a respeito da rentabilidade de uma promoção.


=== Tipos de informação  ===
'''Sequências:''' Na sequência os eventos estão ligados ao longo do tempo. Pode-se descobrir, por exemplo, que quando se compra uma casa, em 65% as vezes se adquire uma nova geladeira no período de duas semanas; e que em 45% das vezes, um fogão também é comprado um mês após a compra da residência.
Segue alguns tipos e técnicas de Mineração de Dados que se é possível obter informações:
* '''Associações:''' É a busca de dados,eventos, que frequentemente ocorrem de forma simultânea em um conjunto de dados.


* '''Sequências:''' São eventos que estão ligados ao longo do tempo. Como exemplo, o que um usuário faz após o primeiro login em uma rede social e assim começa a surgir uma sequência de ações.
'''Classificação:''' Reconhece modelos que descrevem o grupo ao qual o item pertence por meio do exame dos itens já classificados e pela inferência de um conjunto de regras. Exemplo: empresas de operadoras de cartões de crédito e companhias telefônicas preocupam-se com a perda de clientes regulares, a classificação pode ajudar a descobrir as características de clientes que provavelmente virão abandona-las e oferecer um modelo para ajudar os gerentes a prever quem são, de modo que se elabore antecipadamente campanhas especiais para reter esses clientes.


* '''Classificação:''' Reconhece a qual grupo um item pertence através da análise dos itens já classificados anteriormente usando-se um conjunto de regras.  
'''Aglomeração (clustering):''' Funciona de maneira semelhante a classificação quando ainda não foram definidos grupos. Uma ferramenta de data mining descobrirá diferentes agrupamentos dentro da massa de dados. Por exemplo ao encontrar grupos de afinidades para cartões bancários ou ao dividir o banco de dados em categorias de clientes com base na demografia e em investimentos pessoais.
* '''Estimativa ou Regressão:''' É uma função que mapeia os registros de um banco de dados em um intervalo de valores em numéricos reais. Como exemplo, estimar o valor de um imóvel com base no valor de outros imóveis analisados em seu redor, que está registrado no seu banco de dados.
* '''Previsão de Séries Temporais:''' Uma série temporal é um conjunto de registros de um fenômeno que é organizado em ordem temporal, como hora,minuto,dia,mês,ano. Como exemplo, registro de eventos no decorrer de um mês podendo ser o quanto foi gasto no mês de energia que é um conjunto mensal ou a quantidade de vezes em que o usuário realizou um login em uma rede social em 1 dia e gerar dados a partir disto.
* '''Sumarização:''' Consiste em identificar e indicar similaridades entre registros do conjunto de dados.


* '''Aglomeração:''' Funciona de maneira semelhante a classificação porém trabalha com grupos indefinidos. Trabalhando com grupos de dados indefinidos aglomerando dados que se relacionam como, agrupar clientes com comportamento de compra similar, a fim de melhor recomendar novos produtos para esses clientes.
'''Prognóstico:''' Embora todas essas aplicações envolvam previsões, os prognósticos as utilizam de modo diferente. Partem de uma série de valores existentes para prever quais serão os outros valores. Por exemplo um prognóstico pode descobrir padrões nos dados que ajudam os gerentes a estimar o valor futuro de variáveis com números de vendas.


* '''Prognóstico:''' Prognóstico partem de uma série de valores existentes para prever quais serão os próximos valores. Por exemplo um prognóstico pode descobrir padrões nos dados que ajudam os gerentes a estimar sobre o números de vendas e também uma receita aproximada.
1.2 Exemplos


Lembrando que todos esses tipos e técnicas de Mineração de Dados que cito acima eles são adaptados em vários outros segmentos e não apenas no sentido comercial, fazendo exemplos usando o mercado facilita a compreensão, não há um limite de como se fazer a mineração, irá depender do profissional de como relacionar todas as informações brutas em alguma informação que tenha valor, toda a mineração é realizada através de uma pesquisa de um banco de dados, que segue uma lógica.  
Utilizando as técnicas da mineração de dados, um programa de obtenção de conhecimento depois de examinar milhares de alunos forneceu a seguinte regra: se o candidato é do sexo feminino, trabalha e teve aprovação com boas notas no vestibular, então não efetivava a matrícula. Estranho, ninguém havia pensado nisso. Mas uma reflexão justifica a regra oferecida pelo programa: de acordo com os costumes do Rio de Janeiro, uma mulher em idade de vestibular, se trabalha é porque precisa, e neste caso deve ter feito inscrição para ingressar na universidade pública gratuita. Se teve boas notas provavelmente foi aprovada na universidade pública onde efetivará matrícula. Claro que há exceções: pessoas que moram em frente à PUC, pessoas mais velhas, de alto poder aquisitivo e que voltaram a estudar por outras razões que ter uma profissão, etc.. Mas a grande maioria obedece à regra anunciada.


=== Exemplos ===
2 Referências Bibliográficas
'''Comércio'''


    Suponhamos que em um supermercado acontece a seguinte situação:
https://msdn.microsoft.com/pt-br/library/ms174949.aspx
A maioria dos clientes que adquiriram pão e leite desnatado também adquiriram manteiga ou margarina.
https://pt.wikipedia.org/wiki/Minera%C3%A7%C3%A3o_de_dados#Tipos_de_informa.C3.A7.C3.A3o_obtidos_com_a_Minera.C3.A7.C3.A3o_de_Dados
Só é possível descobrir a incidência destes casos apenas com uma Mineração de Dados, com isso foi possível então constatar um padrão de compras entre a maior parte dos clientes e com esta informação o supermercado pode tomar ações para atender mais este tipo de demanda colocando mais a disposição nas prateleiras do supermercado certos produtos que tem um padrão de compras para incentivar ainda mais este hábito.
 
'''Energia'''
 
Em um cenário onde se está em época de poucas chuvas, é preciso aplicar técnicas de Mineração de Dados para a geração de modelos e relatórios que façam a previsão da demanda de consumo de energia elétrica por regiões, as técnicas utilizadas são a Regressão e a Previsão de Séries Temporais, assim é possível conseguir as dados para análise. Para se obter estes dados foram utilizados registros de consumo de energia elétrica ao longo de períodos anteriores.
 
'''Medicina'''
 
Um projeto de Data Mining foi realizado na área de Citopatologia para extrair conhecimento que auxiliasse na detecção e na prevenção de câncer de colo de útero. A base de dados analisada continha informações sobre diversas pacientes de vários municípios do Rio Grande do Sul, incluindo imagens das amostras de material (células) coletado para exame citopatológico. Considerando o grande volume de amostras a ser analisado, o projeto teve como objetivo construir um modelo de classificação que permitisse auxiliar no diagnóstico da doença a partir das imagens e dos dados das amostras coletadas em novas pacientes (tarefa de Classificação).
 
== Referências Bibliográficas ==
Links:
* [https://pt.wikipedia.org/wiki/Minera%C3%A7%C3%A3o_de_dados <nowiki>[1] Mineração de Dados - Wikipedia]</nowiki>]
* [http://www.sas.com/pt_br/insights/analytics/mineracao-de-dados.html <nowiki>[2] Mineração de Dados, O que é e por que é importante? - SAS]</nowiki>]
* [http://computerworld.com.br/exemplos-de-aplicacoes-de-data-mining-no-mercado-brasileiro <nowiki>[3]</nowiki>] [http://computerworld.com.br/exemplos-de-aplicacoes-de-data-mining-no-mercado-brasileiro Exemplos de aplicações de data mining no mercado brasileiro - Ronaldo Goldschmidt e Eduardo Bezerra]
* [https://msdn.microsoft.com/pt-br/library/ms174949.aspx <nowiki>[4] Conceitos de mineração de dados - Microsoft Developer Network]</nowiki>]

Edição atual tal como às 18h13min de 22 de maio de 2017

1 Conceito

A mineração de dados é o processo de descoberta de informações acionáveis em grandes conjuntos de dados. A mineração de dados usa análise matemática para derivar padrões e tendências que existem nos dados. Normalmente, esses padrões não podem ser descobertos com a exploração de dados tradicional pelo fato de as relações serem muito complexas ou por haver muitos dados.

1.1 Tipos de informação

Associações: São ocorrências ligadas a um único evento. Por exemplo:um estudos de modelos de compra em supermercados pode revelar que, na compra de salgadinhos de milho, compra-se também um refrigerante tipo cola em 65% das vezes: mas, quando há uma promoção, o refrigerante é comprado em 85% das vezes.Com essas informações, os gerentes podem tomar decisões mais acertadas pois aprenderam a respeito da rentabilidade de uma promoção.

Sequências: Na sequência os eventos estão ligados ao longo do tempo. Pode-se descobrir, por exemplo, que quando se compra uma casa, em 65% as vezes se adquire uma nova geladeira no período de duas semanas; e que em 45% das vezes, um fogão também é comprado um mês após a compra da residência.

Classificação: Reconhece modelos que descrevem o grupo ao qual o item pertence por meio do exame dos itens já classificados e pela inferência de um conjunto de regras. Exemplo: empresas de operadoras de cartões de crédito e companhias telefônicas preocupam-se com a perda de clientes regulares, a classificação pode ajudar a descobrir as características de clientes que provavelmente virão abandona-las e oferecer um modelo para ajudar os gerentes a prever quem são, de modo que se elabore antecipadamente campanhas especiais para reter esses clientes.

Aglomeração (clustering): Funciona de maneira semelhante a classificação quando ainda não foram definidos grupos. Uma ferramenta de data mining descobrirá diferentes agrupamentos dentro da massa de dados. Por exemplo ao encontrar grupos de afinidades para cartões bancários ou ao dividir o banco de dados em categorias de clientes com base na demografia e em investimentos pessoais.

Prognóstico: Embora todas essas aplicações envolvam previsões, os prognósticos as utilizam de modo diferente. Partem de uma série de valores existentes para prever quais serão os outros valores. Por exemplo um prognóstico pode descobrir padrões nos dados que ajudam os gerentes a estimar o valor futuro de variáveis com números de vendas.

1.2 Exemplos

Utilizando as técnicas da mineração de dados, um programa de obtenção de conhecimento depois de examinar milhares de alunos forneceu a seguinte regra: se o candidato é do sexo feminino, trabalha e teve aprovação com boas notas no vestibular, então não efetivava a matrícula. Estranho, ninguém havia pensado nisso. Mas uma reflexão justifica a regra oferecida pelo programa: de acordo com os costumes do Rio de Janeiro, uma mulher em idade de vestibular, se trabalha é porque precisa, e neste caso deve ter feito inscrição para ingressar na universidade pública gratuita. Se teve boas notas provavelmente foi aprovada na universidade pública onde efetivará matrícula. Claro que há exceções: pessoas que moram em frente à PUC, pessoas mais velhas, de alto poder aquisitivo e que voltaram a estudar por outras razões que ter uma profissão, etc.. Mas a grande maioria obedece à regra anunciada.

2 Referências Bibliográficas

https://msdn.microsoft.com/pt-br/library/ms174949.aspx https://pt.wikipedia.org/wiki/Minera%C3%A7%C3%A3o_de_dados#Tipos_de_informa.C3.A7.C3.A3o_obtidos_com_a_Minera.C3.A7.C3.A3o_de_Dados