Normalização
- Material filtrado da Internet: (Temporário)
Dependência Funcional
- Consiste numa restrição entre dois conjuntos de atributos de uma mesma entidade/relação
- Uma dependência funcional é representada pela relação X -> Y, em que X e Y são subconjuntos de atributos de uma relação qualquer
- Isso impõe uma restrição na qual um componente Y de uma tupla (registro) é dependente de um valor do componente X (ou é determinado por ele)
- Do mesmo modo, o valores do componente X determinam de forma unívoca os valores do componente Y
- Resumindo, Y é dependente funcionalmente de X
- Supondo o esquema de uma relação abaixo, onde os três primeiros atributos, cujos nomes se encontram destacados, representam a chave primária da relação
- MatriculaAluno
- CodigoCurso
- CodigoDisciplina
- NomeAluno
- DataMatricula
- NomeCurso
- NomeDisciplina
- NotaProva
- Podemos estabelecer 4 dependências funcionais neste exemplo:
- MatriculaAluno -> {NomeAluno, DataMatricula) => O valor do atributo MatriculaAluno determina o valor dos atributos NomeAluno e DataMatricula
- CodigoCurso -> NomeCurso => O valor do atributo CodigoCurso determina o valor do atributo NomeCurso
- CodigoDisciplina -> NomeDisciplina => O valor do atributo CodigoDisciplina determina o valor do atributo NomeDisciplina
- {MatriculaAluno, CodigoCurso, CodigoDisciplina} -> NotaProva => A combinação de valores dos atributos MatriculaAluno, CodigoCurso e CodigoDisciplina determina o valor do atributo NotaProva.
Normalização
- Após a construção do modelo conceitual dos dados (Modelo Entidade/Relacionamento) é feita a transformação para o modelo lógico (Esquema de Tabelas)
- O desenho de tabelas obtido representa a estrutura da informação de um modo natural e completo.
- Normalização é um processo baseado nas chamadas formais normais
- Uma forma normal é uma regra que deve ser aplicada na construção das tabelas do banco de dados para que estas fiquem bem estruturadas
- A normalização pode ser entendida como um processo submetido a estas varias formas normais
- Objetivo principal: eliminar a redundância nos dados armazenados em tabelas, resultando na diminuição do espaço e dos riscos de inconsistências em atualizações de dados
- Quando um atributo é alterado em uma tabela que não está totalmente normalizada, é necessário alterá-lo em todas as linhas em que ele ocorre, haja visto a sua repetição
- Tal operação poderia ser executada apenas uma vez, caso este atributo estivesse normalizado
- As formas têm uma ordem e são dependentes, isto é, para se aplicar a segunda norma, deve-se obrigatoriamente ter aplicado a primeira e assim por diante.
- Efetivamente, a Normalização tem como objetivo avaliar a qualidade do Modelo de Tabelas e transformá-lo (em caso de necessidade) num Modelo (Conjunto de Tabelas) equivalente, menos redundante e mais estável.
1FN
- Verificação de Tabelas Aninhadas
- Uma relação está na 1a. Forma Normal se e somente se cada linha contiver exatamente um valor para cada atributo
- Dado que as Relações(Tabelas) são estruturas bidimensionais, então no cruzamento de uma linha com uma coluna (atributo) só é possível armazenar valores atômicos.
- Para isso, não deve conter tabelas aninhadas
- Um jeito fácil de verificar esta norma é fazer uma leitura dos campos das tabelas fazendo a pergunta:
- Este campo depende de algum outro?
- Se sim, então devemos arrumar um método para corrigir o problema.
- Método:
- Remover o grupo de repetição
- Expandir a chave primária
- Seguindo a definição devemos normalizar a tabela decompondo-a em duas
- Uma relação R está na 1FN se:
- Todo valor em R for atômico
- Ou seja, R não contém grupos de repetição
- Considerações:
- Geralmente considerada parte da definição formal de uma relação
- Não permite atributos multivalorados, compostos ou suas combinações
Caso 1
cliente (NroCliente, Nome, {End-Cliente})
Corrigindo o problema:
Solução: cliente (NroCliente, Nome, End-Cliente, CidCliente, UFCliente)
Caso 2
- Exemplificando com a tabela Venda
- Esquema relacional da tabela:
Venda
Codvenda (Int)
Cliente (Str)
Endereco (Str)
Cep (Int)
Cidade (Str)
Estado (Str)
Telefone (Int)
Produto (Str)
Quantidade (Float)
ValorUnitário (Float)
PreçoTotal (Float)
- Análise:
- A tabela Venda, deve armazenar informações da venda
- O campo Cliente é dependente de CodVenda, afinal para cada Venda há um cliente
- Campo Endereço: não depende de Codvenda, e sim de Cliente, pois é uma informação particular ao cliente
- Não existe um endereço de venda, existe sim um endereço do cliente para qual se fez a venda
- Nisso podemos ver uma tabela aninhada. Os campos entre colchetes, são referentes ao cliente e não é venda
Venda (Codvenda, [Cliente, Endereço, Cep, Cidade, Estado, Telefone], Produto, Quantidade, ValorUnitário, PreçoTotal)
- Solução:
- Extrair estes campos para uma nova tabela
- Adicionar uma chave-primária à nova tabela
- Relacioná-la com a tabela Venda criando uma chave-estrangeira
- Resultado:
Cliente (Codcliente, Nome, Endereço, Cep, Cidade, Estado, Telefone).
Venda (Codvenda, Codcliente, Produto, Quantidade, ValorUnitário, PreçoTotal).
- Aplicando novamente a 1a. forma normal às 2 tabelas geradas
- Uma situação comum em tabelas de cadastro é o caso Cidade-Estado
- Analisando friamente pela forma normal, o Estado na tabela Cliente, depende de Cidade
- No entanto Cidade, também depende de Estado, pois no caso de a cidade ser Curitiba o estado sempre deverá ser Paraná, porém se o Estado for Paraná, a cidade também poderá ser Londrina
- Isso é o que chamamos de Dependência funcional:
- aparentemente, uma informação depende da outra
- No caso Cidade-Estado a solução é simples:
- Extraímos Cidade e Estado, de Cliente e geramos uma nova tabela
- Em seguida, o mesmo processo feito anteriormente:
- Adicionar uma chave-primária à nova tabela e relacioná-la criando uma chave-estrangeira na antiga tabela
Cidade (Codcidade, Nome, Estado). Cliente (Codcliente, Codcidade, Nome, Endereço, Cep, Telefone) Venda (Codvenda, Codcliente, Codcidade, Produto, Quantidade, ValorUnitário, PreçoTotal)
- Seguindo com o exemplo, a tabela Cliente encontra-se na 1a. forma normal, pois não há mais tabelas aninhadas
- Verificando Venda, identificamos mais uma tabela aninhada
- Os campos entre colchetes são referente à mesma coisa: Produto de Venda
Venda (Codvenda, Codcliente, Codcidade, [Produto, Quantidade, Valorunitario, Valorfinal])
- Na maioria das situações, produtos têm um valor previamente especificado
- O ValorUnitário depende de Produto
- Já a Quantidade não depende do Produto e sim da Venda
Cidade (Codcidade, Nome, Estado) Cliente (Codcliente, Codcidade, Nome, Endereço, Cep, Telefone) Produto (Codproduto, Nome, ValorUnitário) Venda (Codvenda, Codcliente, Codcidade, Codproduto, Quantidade, PreçoTotal)
- Utilizando a 1a. Forma Normal na tabela Venda, obtivemos 3 tabelas
2FN
- A 2a. Forma Normal exige um pouco mais de conhecimento sobre as dependências funcionais, prioritariamente para a dependência funcional total
- Uma relação está na 2a. Forma Normal se estiver na 1a. e se todos os atributos descritores (não pertencentes a nenhuma chave candidata) dependerem da totalidade da chave (e não apenas de parte dela)
- Isso quer dizer que uma tabela encontra-se na 2FN, quando, além de estar na 1FN, não contem dependências parciais
- Dependência parcial = uma dependência parcial ocorre quando uma coluna depende apenas de parte de uma chave primária composta
- Resumindo, a entidade se encontra na 2FN se, além de estar na 1a., todos os seus atributos são totalmente dependentes da chave primária composta
- Significa que atributos que são parcialmente dependentes devem ser removidos.
- Se observarmos as tabelas e identificarmos repetição dos dados nas tuplas requer-se a 2FN
- Relendo cada campo e questionando:
- Este campo depende de toda a chave?
- Se não, temos uma dependência parcial
Caso 3
- Uma entidade Item possui chave primária composta que é constituída pelos atributos NumPedido e CodProduto
- Os atributos Descricao e PrecoUnit não dependem totalmente dessa chave, ao contrário de Quantidade e ValorTotal
- Nova entidade: Produto
- Entidades:
- Arquivo:BDA-Normalizacao-2FN.pdf
- Tabelas populadas:
- Arquivo:BDA-Normalizacao-2FN-b.pdf
Caso 4
- Reavaliando o caso Cidade-Estado que gerava uma dependência funcional
- Após a normalização da tabela Venda, obtivemos uma chave composta de 4 campos:
Venda (Codvenda, Codcliente, Codcidade, Codproduto, Quantidade, PreçoTotal)
- A questão agora é verificar se cada campo não-chave depende destas 4 chaves
- Procedimento:
- O 1o. campo não-chave é Quantidade
- Quantidade depende de Codvenda => Para cada venda há uma quantidade específica de itens
- Quantidade depende de Codvenda e Codcliente => Para um cliente podem ser feitas várias vendas, com quantidades diferentes
- Quantidade não depende de Cidade e quem depende de Cidade é Cliente
- Temos uma dependência parcial pois Quantidade depende de Codproduto, pois para cada produto da Venda há uma quantidade certa
- Quantidade depende de 3 campos, dos 4 que compõe a chave de Venda
- Quem sobra nessa história é Codcidade
- A tabela Cidade já está ligada com Cliente, que já está ligada com Venda
- A chave Codcidade em Venda é redundante, portanto podemos eliminá-la
Venda (Codvenda, Codcliente, Codproduto, Quantidade, PrecoTotal)
- Problema:
- Existe alguma necessidade de manter CodCidade como campo não-chave?
- O próximo campo não-chave é PreçoTotal
- Avaliando PreçoTotal da mesma forma que Quantidade
- Chega-se à conclusão de que ele depende de toda a chave de Venda.
3FN
- Uma relação encontra-se na 3a. Forma Normal se estiver na 2a. Forma Normal e se não existirem atributos descritores (não pertencentes a nenhuma Chave Candidata) a dependerem funcionalmente de outros atributos descritores (não-chaves)
- Após a aplicação das regras da 2FN se ainda restarem dados redundantes na tabela avaliada pode-se empregar a 3FN
- Terceira Forma Normal (3FN):
- Efetivamente, uma tabela encontra-se na terceira forma normal, quando, além de estar na 2FN, não contém dependências transitivas
- Dependência transitiva:
- Uma dependência funcional transitiva ocorre quando uma coluna, além de depender da chave primária da tabela, depende de outra coluna ou conjunto de colunas da tabela
- Assim sendo, cada atributo deve depender apenas das Chaves Candidatas da relação.
Caso 5
- Em Pedidos, existem atributos que identificam:
- um cliente (nome do cliente e endereço completo)
- um vendedor (nome do vendedor)
- Os dados dos atributos:
NomeCliente
EndCliente
CidCliente
UFCliente
- são dependentes de CodCliente
- Podemos criar outra entidade => Cliente
- Da mesma forma, NomeVendedor é dependente de CodVendedor
- Entidades:
- Arquivo:BDA-Normalizacao-3FN.pdf
- Tabelas populadas:
- Arquivo:BDA-Normalizacao-3FN-B.pdf