You are on page 1of 57

Modelagem Dimensional

Bsico ao avanado

Thiago Arajo S . de Oliveira

Modelagem Dimensional

Proposto por Ralph Kimball

Dominante em projeto de DW(em qualquer


plataforma)

Caractersticas

Modelagem estrela
Inteligvel
Performtica
2
Modelagem Dimensional

Modelo Estrela

3
Modelagem Dimensional

Modelo Estrela - Vendas

4
Modelagem Dimensional

Exemplo de Consultas

5
Modelagem Dimensional

Consulta Gerada

6
Modelagem Dimensional

Modelo Estrela - Ocorrncia


Policial
Crime
Unidade
Ocorrncia

Instrumento

Tempo
Localizao

7
Modelagem Dimensional

Exemplos de consultas

8
Modelagem Dimensional

Identificando dimenses

9
Modelagem Dimensional

Modelagem Dimensional

Esquema Estrela simtrico

Comparado com relao aos esquemas ERs

Tabela de Fatos

Dominante

Usualmente com grande volume de dados

Tabelas de Dimenses

Tabelas que qualificam os fatos

Uma juno liga cada tabela de dimenso tabela

de fatos

volume bem menor que as tabelas de fatos


10
Modelagem Dimensional

Comparao ER x Dimensional

11
Modelagem Dimensional

Tabela de Fatos

Composta pelas chaves das dimenses


Dimenso tempo sempre parte da chave
(DW histrico)
Medida do fato usualmente numrica

Aditivas

Semi-aditivas

No aditivas

Fato Ocorrncia
id_unidade
id_tempo
id_crime
id_instrumento
id_localizacao
12
Modelagem Dimensional

Fatos Aditivos

So numricos e podem ser somados em


todas as dimenses
Dado numrico apresentado no processo
de negcio ser um bom indcio de uma
medida em na fato
Valor de Venda, Quantidade.. etc

13
Modelagem Dimensional

Fatos semi-aditivos

Tambm so numricos

No podem ser somados em relao a


todas as dimenses existentes

Geralmente a Tempo

So dados de snapshots que j consideram


valores passados

Saldos, balanos...
14
Modelagem Dimensional

Fatos no aditivos

Porcentagens e propores so noaditivas.


Faz pouco taxas de lucro, produtividade,
efetividade... etc

15
Modelagem Dimensional

Tabelas Dimenses

Objetivo

Servir como agrupamento das linhas e colunas das


anlises e filtro nas consultas/relatrios

Caractersticas:

Chaves simples (em geral, artificiais: surrogate keys)

Descrio nica para cada registro

Usualmente no dependente do tempo

Desnormalizada

Hierarquias implcitas

Crime

Policial

Modelagem Dimensional

id_policial
matricula
patente
nome
cpf

id_crime
tipo_crime
desc_crime
Localizao
...
16

Hierarquias de Dimenses

Uma dimenso pode ter mltiplas


hierarquias alm de outros atributos
descritivos

Exemplo Dimenso Policial

Patente, Escolaridade,
Atuao(Campo/Administrativo)

Uso a depender da anlise...


17
Modelagem Dimensional

Passos da modelagem
dimensional
1.Definio da rea do negcio
2.Definir processos dentro da rea de negcio
3.Definio a granularidade desejada para os
dados de cada processo
4.Definio dos atributos e hierarquia das
dimenses
5.Definio das mtricas das tabelas de Fatos
Observar valores aditivos, semi-aditivos e no aditivos
18
Modelagem Dimensional

Exerccio Faam vocs...

Usem os exemplos identificados na ltima aula


19
Modelagem Dimensional

Estudos de caso

20
Modelagem Dimensional

Exemplos...
Estoque calculado

21
Modelagem Dimensional

Exemplos...

Requisies/Sadas

22
Modelagem Dimensional

Exemplos...

Requisies de itens em falta

23
Modelagem Dimensional

Dashboards

24
Modelagem Dimensional

Dashboards
Giro mensal atravs das
requisies

25
Modelagem Dimensional

Estudo de caso

Acesso ao dados.al.gov.br
26
Modelagem Dimensional

Estudo de caso

Acesso ao dados.al.gov.br
27
Modelagem Dimensional

Alagoas em Dados

28
Modelagem Dimensional

Alagoas em Dados

Catlogo de dados carregado a partir do DW


29
Modelagem Dimensional

Fonte para Relatrios

30
Modelagem Dimensional

Fonte para Relatrios

31
Modelagem Dimensional

Voltando ao contedo...

32
Modelagem Dimensional

Modelagem Dimensional

Avanado

33
Modelagem Dimensional

Modelagem dimensional

Durante a prtica encontramos diversos


obstculos no previstos....

34
Modelagem Dimensional

Roteiro

Dimenses clssicas

Tabelas de Fato sem Fatos

Dimenses Degeneradas (dimenses sem tabelas)

Esquemas com muitas dimenses(Centopia)

Campos Chaves das Dimenses(Substitutas)

Dinmica das Dimenses: Slowly Changing Dimension

Dimenses com Papis

Dimenses Bugiganga

Minidimenses

Dimenses multivaloradas

35
Modelagem Dimensional

Esquema Estrela

Quando

Quanto foi
Quanto custou

Quem

Porqu

Como

Dimenses clssicas

O que

36
Modelagem Dimensional

Dimenso Tempo

Mais poderosa e importante em todo DW - MDX

Costuma ser complexa no mundo real:

Dia, Ms, Trimestre, Semestre, Ano

Dia Acumulado no Ms, no Ano

Perodo Fiscal, Semana de Cinco Dias

Feriados, Fim de semana

Qual a granularidade ideal?Dia, Hora?

Pode ser carregada antecipadamente


37
Modelagem Dimensional

Dimenso Tempo
Exemplo: 5 anos passados + 5 anos futuros = 10 anos =
3.650 dias (linhas na tabela)

38
Modelagem Dimensional

Dimenso Hora

1 Alternativa: Colocar a hora do dia na Tabela de Fatos

Poucos benefcios e desperdcio de espao

2 Alternativa: Criar uma Dimenso Hora do Dia

(24 h X 60 min = 1440 valores)

Permite novas agregaes e recursos MDX

3 Alternativa : Hora, minuto na mesma tabela de


dimenso que as datas

10 anos = 3.650 x 1.440 minutos = 5.256.000


linhas (525.600 linhas cada ano adicional)

39
Modelagem Dimensional

Tabela sem Fatos


Uma tabela de fatos que no tem fatos(medidas) mas captura
alguns relacionamentos muitos-para-muitos entre chaves
de dimenses. Mais frequentemente usada para
representar eventos ou prover informao de cobertura
que no aparece em outras tabelas de fatos.
Ex.: Ocorrncias

40
Modelagem Dimensional

Tabela sem fatos ex.


cobertura
Cobertura de Promoo
Loja
Tempo
CoberturaPromocao
Promocao

Produto

Registra todos os produtos que esto em promoo


numa determinada loja, independentemente de ser
vendidos ou no.
41
Modelagem Dimensional

Dimenses Degeneradas

Chaves de dimenso na tabela de fatos


sem tabelas de dimenso
correspondentes.
Ex. nmero de uma transao, nmero de
fatura, nota fiscal, ordem de compra, no
possuem nenhum atributo, portanto no
se justifica com uma tabela de dimenso.
Usada apenas para fins de agrupamento
42
Modelagem Dimensional

Esquemas com muitas


dimenses (Centopia)
Um nmero de dimenses muito grande (25+)
sinal de que muitas dimenses no so
completamente independentes e deveriam ser
combinadas numa nica.

43
Modelagem Dimensional

Chaves Substitutas
(Surrogate keys)

Ajudam a manter a estabilidade, atravs da


neutralidade

Chaves naturais podem ter problemas de unicidade,


ausncia, tamanhos exagerados.

Chaves artificiais podem ser especificadas como


inteiros de 4 bytes, alcanando at 2, isto , mais de
2 bilhes de ocorrncias.

Chaves artificiais ficam transparentes (invisveis) para


os usurios, servindo apenas como ligao entre
dimenses e fatos.
44
Modelagem Dimensional

Dinmica das dimenses

Atualizao das dimenses que mudam lentamente (Slowly


Changing Dimensions)

Ex.: Dados do policial(patente), dados do cliente

Alternativas

Tipo 1: Atualizar por cima do valor antigo

Tipo 2: Adicionar uma nova linha com o novo valor do atributo


atualizado, mantendo os demais

Mais simples, mas perdemos o histrico

Tcnica predominante

Tipo 3: Adicionar uma nova coluna, preservando o valor anterior e


inserindo o novo valor na nova coluna.

Permite a manuteno de duas vises simultneas do histrico, mas d


margem a muitos valores nulos.
45
Modelagem Dimensional

Exemplo: Tipos 1,2 e 3


Linha original
id_policial

matricula nome

patente

10

3242343

Thiago Arajo S. de Oliveira

sargento

Mudana de Patente
SCD Tipo 1 - Atualizao
id_policial

matricula

nome

patente

10

3242343

Thiago Arajo S. de Oliveira

2 tenente

id_policial matricula

nome

patente

Datas

10

3242343

Thiago Arajo S. de Oliveira

sargento

...

11

3242343

Thiago Arajo S. de Oliveira

2 tenente

...

SCD Tipo 2 Nova Linha

46
Modelagem Dimensional

Exemplo: Tipos 1,2 e 3


Linha original
id_policial

matricula nome

patente

10

3242343

sargento

Thiago Arajo S. de Oliveira

Mudana de Patente
SCD Tipo 3 Mantm histrico
id_policial matricula

nome

10

Thiago Arajo S. de Oliveira 2 tenente

3242343

patente

patente_ant
sargento

Obs.: Ainda existem solues hibridas novas linhas mas salvando o


histrico numa nova coluna

47
Modelagem Dimensional

Minidimenses

Problemtica: Dimenses com grande


volume e alta volatilidade

Ex.: Faixa de renda, endereo, qnt de filhos,


escolaridade dados demogrficos
Dim. Cliente
nome
data_nascimento
cpf
...
Dim. Demografia
faixa_renda
classificacao_end
faixa_filhos
...

Fato Venda

As tabelas quebradas de uma dimenso


grande so tambm chamadas de
minidimenses
48

Modelagem Dimensional

Dimenses com vrios Papis

A situao onde uma mesma dimenso


aparece vrias vezes na mesma tabela de
fatos.

Ex.: Data, Delegado da ocorrncia/investigao


DataRegistro

DelegadoRegistro
Ocorrncia

DataConclusao

DelegadoInvestigacao

49
Modelagem Dimensional

Dimenso com vrios papeis


Outro exemplo

50
Modelagem Dimensional

Dimenses Bugiganga

Relacionadas com
tabelas tipo cdigodescrio com baixa
cardinalidade: Sexo,
Estado Civil, Tags
diversos, Textos
descritivos, etc.

Dimenso Junk Patrimnio


51
Modelagem Dimensional

Dimenses Multivaloradas

Um muitos-para-muitos que no possa ser


acomodado pela granularidade natural de uma
tabela de fatos ou tabela de dimenso.
Uma ponte entre a tabela de fatos e a tabela de
dimenso de forma a permitir dimenses
multivaloradas
Equipe
*
Ocorrncia

Policial

52
Modelagem Dimensional

Tipos de Fatos

Fatos de transao

Fatos Instantneos Peridicos

Fatos Instantneos Acumulados

53
Modelagem Dimensional

Fato Transao
O nvel de transao individual representa a
viso mais fundamental das operaes do
negcio.
Essas
tabelas
de
fatos
representam um evento que ocorreu num
ponto instantneo do tempo.

Ex.: Venda, Ocorrncia, Entrada no Estoque

54
Modelagem Dimensional

Fatos Instantneos Peridicos


So necessrios para observar o desempenho
cumulativo do negcio em intervalos de tempo
regulares e previsveis. Diferentemente do fato de
transao, onde se carrega uma linha para cada
ocorrncia de evento, com o instantneo peridico,
tira-se uma fotografia da atividade no fim de um
dia, uma semana ou um ms, repetidamente ao
fim de cada perodo.

Ex.: Saldo da conta, saldo do estoque, quilometragem


da fronta
55
Modelagem Dimensional

Fatos Instantneos Peridicos

Cuidado com o crescimento do volume


dos dados

Saldo dirios... histrico

Solues particionamento

Dados recentes em maior detalhe dirio,


semanal... dados antigos mensal :)

56
Modelagem Dimensional

Fatos instantneos
acumulados
Representam um tempo indeterminado, que
cobre o ciclo de vida da transao ou do
produto ou pessoa. Quase sempre possuem
mltiplas
datas,
representando
os
mltiplos eventos ou fases que ocorrem
durante o curso de um ciclo de vida.

Exemplo:
justia...)

Ocorrncia(registro,

inquerito,

57
Modelagem Dimensional

You might also like