Professional Documents
Culture Documents
Objetivo
Apresentar:
conceitos as caractersticas de um Data Warehouse algumas arquiteturas
Modelos de dados Desenvolvimento do Data Warehouse Povoamento do Data Warehouse Extrao de informaes do Data Warehouse Anlise do uso da tecnologia Data Warehouse
2
Plano
CONCEITOS As Caractersticas de um Data Warehouse Algumas arquiteturas Modelos de dados Desenvolvimento do Data Warehouse Povoamento do Data Warehouse Extrao de informaes do Data Warehouse Anlise do uso da tecnologia Data Warehouse
3
Data Warehouse
Definio I:
uma coleo de dados orientados por assuntos, integrados, variveis no tempo e no volteis, para dar suporte ao processo gerencial de tomada de deciso [ Inmon ]
Data Warehouse
Definio II:
um processo em andamento que aglutina dados de fontes heterogneas, incluindo dados histricos e dados externos para atender s necessidades de consultas estruturadas e ad-hoc, relatrios analticos e de suporte a deciso [Harjinder ]
Data Warehouse
Definio III:
uma coleo de tcnicas e tecnologias que juntas disponibilizam um enfoque pragmtico e sistemtico para tratar com o problema do usurio final de acessar informaes que esto distribudas em vrios sistemas da organizao [ Barquini ]
Data Warehouse
Informativo OLAP Carga e consulta Centenas Comunidade gerencial Pr-definida e ad-hoc Dados Analticos Gigabytes - terabytes 5 a 10 anos
7
Data Warehouse
Detalhados e resumidos Ocorre Varivel Constante Milhares Peridica (batch) A cada atualizao Muitos / complexos Aperfeioar consultas
Aplicativos
9
Plano
Conceitos AS CARACTERSTICAS DE UM DATA WAREHOUSE Algumas arquiteturas Modelos de dados Desenvolvimento do Data Warehouse Povoamento do Data Warehouse Extrao de informaes do Data Warehouse Anlise do uso da tecnologia Data Warehouse
10
11
Integrao
Aplicao B Aplicao C Valor atual, 2 anos
(a)
Aplicao A Aplicao B
(b)
Aplicao C
Aplicao A
Integrao de dados
DATA WAREHOUSE sexo: m, f caminho: centmetros
OPERACIONAL Aplicao A: m,f Aplicao B: 1,0 Aplicao C: masculino, feminino Aplicao A: caminho - centmetros Aplicao B: caminho - ps Aplicao C: caminho - jardas Aplicao A: descrio Aplicao B: descrio Aplicao C: descrio Aplicao A: chave char(10) Aplicao B: chave dec fixed(9,2) Aplicao C: chave char(12)
descrio
Chave char(12)
14
DATA WAREHOUSE
- Maria Silva - Feminino - Nascida em 01/12/68 - Duas internaes em 2000 - Equipe mdica - Durao mdia das internaes - Exames requeridos - Resultados dos exames - Casada - 2 filhos
15
DATA WAREHOUSE
alterar
acessar excluir carregar acessar excluir incluir alterar
17
18
19
Alta
Prod. A1 B1 A1 A1
Qtda. 10 15 20 90
21
Fontes de metadados Repositrios de ferramentas CASE Documentao do desenvolvimento dos sistemas operacionais Cdigo fonte dos sistemas operacionais Entrevistas O prprio ambiente do Data Warehouse
informaes tais como freqncia da acesso, em que nvel de agregao, tempo de resposta de cada consulta, etc..
23
Plano
Conceitos As caractersticas de um Data Warehouse ALGUMAS ARQUITETURAS Modelos de dados Desenvolvimento do Data Warehouse Povoamento do Data Warehouse Extrao de informaes do Data Warehouse Anlise do uso da tecnologia Data Warehouse
24
Camada de transporte:
Esta camada gerencia o transporte de informaes pelo ambiente de rede. Inclui a coleta de mensagens e transaes e se encarrega de entreg-las em locais e tempos determinados.
27
Um componente back end: conjunto de aplicaes responsveis por extrair, filtrar, transformar, integrar e carregar os dados de diferentes origens no DW; Um componente front end: conjunto de aplicaes responsveis por disponibilizar aos usurios finais acesso ao DW; Um repositrio para armazenar e gerenciar os metadados do sistema.
Componente front-end Data Warehouse (SGBD)
Componente back-end
Fontes externas
28
Upflow
Metaflow
Inflow
Repositrio de metadados
Component e back-end
Data Warehouse
Downflow
Fontes internas
Dados antigos
Fontes externas
29
Data warehouse
Integrador
Extrator
Extrator
Extrator
Base de dados
Base de dados
Base de dados
30
31
Arquitetura de dados
Servidor central
Forma de armazenamento:
nico local (centralizado)
Dados altamente resumidos
Dados levemente resumidos
32
Arquitetura de dados
Servidor rea Financeira
Forma de armazenamento:
por rea de interesse (distribudo)
Servidor rea Marketing Dados altamente resumidos
33
Arquitetura de dados
Servidor S2 Servidor S1
Forma de armazenamento:
por nvel de detalhes
Dados altamente resumidos
Dados levemente resumidos
Servidor DW
34
Plano
Conceitos As caractersticas de um Data Warehouse Algumas Arquiteturas MODELO DE DADOS Desenvolvimento do Data Warehouse Povoamento do Data Warehouse Extrao de informaes do Data Warehouse Anlise do uso da tecnologia Data Warehouse
35
Metadados
Definio: (a) metadados so normalmente definidos como dados sobre os dados. (b) metadado uma abstrao dos dados, ou ainda, dados de mais alto nvel que descrevem dados de um nvel inferior. Deve-se
Metadados
Camadas
metadados operacionais:
definem a estrutura dos dados mantidos pelos bancos operacionais, usados pelas aplicaes de produo da empresa;
Metadados
Classificao de metadados:
mapeamento:
descrevem como os dados de bancos operacionais so transformados para chegarem ao data warehouse. Incluem identificao de campos fontes, mapeamentos entre atributos, converses, codificaes, "defaults", etc.;
histrico:
mantm o histrico de mudanas das regras do negcio, pois as regras certas devem ser aplicadas aos dados certos, quando se consideram evolues ao longo do tempo;
miscelnea:
informao de status sobre estgios de desenvolvimento de partes do data warehouse, informaes sobre volume dos dados 38 (para estimativas de tempo e recursos), etc.;
Metadados
Classificao de
metadados:
algoritmos de sumarizao:
mostram a relao entre os diferentes nveis de detalhe dos dados, indicando inclusive que nvel de sumarizao mais adequado para um dado objetivo;
padres de acesso:
mantm informaes sobre freqncia e tipo de acesso aos dados.
39
Plano
Conceitos As caractersticas de um Data Warehouse Algumas Arquiteturas Modelo de dados Esquema: Estrela ou Foco de Neve Povoamento do Data Warehouse Extrao de informaes do Data Warehouse Anlise do uso da tecnologia Data Warehouse
40
Esquema Estrela
41
42
Multi-dimensional
Banco de dados relacional
MODELO COR VENDAS Van Azul 6 Van Vermelho 5 Van Preta 4 Coupe Azul 3 Coupe Vermelho 5 Coupe Preta 5 Sedan Azul 4 Sedan Vermelho 3 Sedan Preta 2
Matriz bidimensional
MODELO Van Coupe Sedan Azul 6 3 4 Vermelho Preta 5 4 5 5 3 2
44
Tipo de processo 2:
Drill down
O "drill-down" consiste em permitir ao usurio "descer" pelas hierarquias das dimenses:
comum o usurio iniciar pelo nvel resumido (tal como vendas nacionais, por marca) e ento seletivamente obter nveis de detalhe adicionais para seguir e explicar uma observao feita no nvel resumido.
Exemplo
Supondo que o produto da marca M tem o pior retorno de vendas em termos nacionais, o analista pode resolver examinar a venda da marca M regionalmente para ver se o problema est relacionado com a distribuio ou algum outro problema regional.
46
Plano
Conceitos As caractersticas de um Data Warehouse Algumas Arquiteturas Modelo de dados Esquema: Estrela ou Foco de Neve Abordagens para o desenvolvimento de um data warehouse Extrao de informaes do Data Warehouse Anlise do uso da tecnologia Data Warehouse
47
Estratgia evolucionria
por assunto:
muitas empresas iniciam o processo a partir de uma rea especfica da empresa, que normalmente uma rea carente de informao e cujo trabalho seja relevante para os negcios da empresa, criando os chamados data marts (um data warehouse departamental), para depois ir crescendo aos poucos, seguindo uma estratgia assunto por assunto.
por experimentao:
outra alternativa selecionar um grupo de usurios, prover ferramentas adequadas, construir um prottipo do data warehouse, deixando que os usurios experimentem com pequenas amostras de dados. Somente aps a concordncia do grupo quanto aos requisitos e funcionamento, que o data warehouse ser de fato carregado com dados dos sistemas operacionais da empresa e dados externos.
49
50
52
Exerccio
Tabela tempo: ano, semestre, quadrimestre, trimestre, bimestre, ms, primeira semana, segunda semana, terceira semana, quarta semana, quinta semana, dia do ms, dia da semana, feriado, distncia de um feriado.
54