You are on page 1of 0

BODEGA DE DATOS BODEGADEDATOS

Por:FabioladelToroOsorio
La toma de decisiones se facilita Latomadedecisionessefacilita
cuandosecuentaconinformacin
En un mercado que cambia, las decisiones
se deben tomar con base al conocimiento se deben tomar con base al conocimiento.
Las bodegas de datos en la actualidad Lasbodegasdedatosenlaactualidad
Enel1994,HowardDresdnerdeGartnerGroup , p
predijolosiguiente:Enel1996,elusodelas
solucionesdeinteligenciadenegociocambiar
dramticamente de analistas dedicados a todos los dramticamentedeanalistasdedicadosatodoslos
gerentesyprofesionalescomolamanerapreferida
deentenderelnegocio.Enlugardeunpequeo g g p q
nmerodeanalistasinvirtiendoelcienporcientode
sutiempoanalizandodatos,todoslosgerentesy
profesionales invertirn el diez por ciento de su profesionalesinvertirneldiezporcientodesu
tiempoutilizandoherramientasdeinteligenciade
negocio
Algunasmotivacionesparala
l d implementacindeDW
Visualizardetalladamentesunegocio
Optimizarsusprocesos
Alcanzarsusmetasyobjetivosapartirdetomadedecisionesbasadasen
conocimiento conocimiento
Intersenmanejargrandesvolmenesdedatosenlatomadedecisiones
Manejodemltiplesyvariadasfuentesdeinformacin
Eliminarladispersindelainformacin p
Minimizarlasinconsistenciasenlainformacin
Facilitarelaccesoalainformacinhistrica
Algunas definiciones de DW AlgunasdefinicionesdeDW
"Yo considero al DW como algo que provee dos YoconsideroalDWcomoalgoqueproveedos
beneficiosempresarialesreales:Integraciny
Acceso de datos DW elimina una gran Accesodedatos.DWeliminaunagran
cantidaddedatosintilesynodeseados,
como tambin el procesamiento desde el comotambinelprocesamientodesdeel
ambienteoperacionalclsico".
1993 Susan Osterfeldt 1993,SusanOsterfeldt
Las bodegas de datos ponen a su Lasbodegasdedatosponenasu
disposicinconocimiento
Esunacoleccindedatospara p
soportealprocesodetomade
d i i decisiones.
W.H.Inmon
Laconstruccinyusodelabodegade
datosparagenerardicho
conocimiento conocimiento
La Bodega de Datos NO es un producto, es
un proceso un proceso
El proceso de unir
datos de diferentes
fuentes, para extraer
Visualizacin Carga Transformacin Extraccin
conocimiento
El almacenamiento de datos debe ser Elalmacenamientodedatosdebeser
usadosegnsuspropiascaracterscas
.
Bases de datos
Orientacinal
Bases de datos
operacionales
Orientacin al
proceso
Sistema de
B d d D t
Orientacin a
T d Bodega de Datos Toma de
decisiones
Losdatosaincluirenlabodega g
potenciansuuso
Losdatosaincluirenlabodegaestnasociados
ainformacinrelevanteenlaorganizacin
Conocimiento
(Toma decisiones)
Ventas
Facturas
Definicin
productos
Recursos
Humanos
Los datos unificados Losdatosunificados
Integrada La base de datos contiene los datos Integrada.Labasededatoscontienelosdatos
detodoslossistemasoperacionalesdela
organizacin y dichos datos deben ser organizacin,ydichosdatosdebenser
consistentes
Fuente1 Fuente2
Ventas
Fuentes Internas
Fuentes Externas
Definicin
productos
Almacen
de Datos
Fuentes Internas
Losdatosreflejanfotosmomentoa j
momento
Variable en el tiempo Variableeneltiempo
Los datos permanecen en el tiempo Losdatospermaneceneneltiempo
No voltil La informacin no se modifica ni se Novoltil.Lainformacinnosemodificanise
elimina,unavezalmacenadoundato,stese
convierte en informacin de slo lectura y se convierteeninformacindeslolectura,yse
mantieneparafuturasconsultas.
Otras visiones de las bodegas de datos Otrasvisionesdelasbodegasdedatos
Unalmacndedatosesunacopiadelas p
transaccionesdedatosespecficamenteestructurada
paralaconsultayelanlisis.
Undatawarehousenoesmsquelaunindetodos
los Data marts de una entidad losDatamarts deunaentidad.
DefinicindeRalphKimball
Los Data mart como un medio para LosDatamartcomounmediopara
paraconsolidarunabodegadedatos
LosDatamarts sonsubconjuntosdedatosdeundata
warehouse para reas especificas warehouse parareasespecificas.
Entrelascaractersticasdeundatamart destacan:
Usuarioslimitados.
reaespecifica.
Tieneunpropsitoespecifico.
Tieneunafuncindeapoyo.
La visualizacin de la informacin se Lavisualizacindelainformacinse
puedehacerapartirdecubos
Componentes de la bodega de datos Componentesdelabodegadedatos
Tomado de The Data Warehouse Toolkit Second Edition
The Complete Guide to Dimensional Modeling The Complete Guide to Dimensional Modeling.
Ralph Kimball, Margy Ross
Losmismoscomponentespueden
d d f versedediferentesmaneras
Herramientas de
BD 1
Fuentes Internas
Herramientas de
consultas e
informes
Herramientas
EIS
BD 2
Almacen
de Datos
ETL
EIS
Herramientas
OLAP
de Datos
Fuente1
Fuente2
Fuentes Externas
Herramientas
Minera
Elmotordelabodegadedatosmaximizaelpotencial
d l d t d l l i delosdemscomponentesdelasolucin
Gartner MQ 2001 Gartner MQ 2007
Diversidaddeherramientaspara
f Extraccin,TrasformacinyCarga
Suite de herramientas de Teradata SuitedeherramientasdeTeradata
IntegrationServicesMicrosoft
S i d h i d O l SuitedeherramientasdeOracle
DataIntegrator&Services
SuitedeherramientasdeIBM
Pentaho Data Integration (Software libre) PentahoDataIntegration (Softwarelibre)

Algunostipsdelasherramientasde
ETL
Rpido acceso a los datos Rpidoaccesoalosdatos
Actualizacindelainformacinoportuna
l bilid d Escalabilidad
Capacidadesdereinicio
Integracinconplataformaslderes
Diversidaddeherramientaspara
l l f Visualizarlainformacin
Gartner 2007
Fuente: Gartner
Desarrolloincrementalymetodologa
claradeimplementacin
Definicindepreguntas Hacia
d d l
Visin
dndeseorientalaorganizacin
Metas
Objetivos
Estrategias
Factores de xito
Preguntas de Negocio
Separtedelanlisisdelos
d l requerimientosdelaDW
Visin
Meta 1 Meta . Meta n
Obj ti 1 Obj ti Obj ti Objetivo 1 Objetivo . Objetivo n
Estrategia 1
Factor de xito 1
Factor de xito n
Activos de Informacin
Estrategia
Estratengia n
Modelandoelnegociosevalidanlos
requerimientosyseiniciaproceso
P e r s o n a
P e r s o n a I D
N u m e r o I d e n t i f i c a c i o n T i p o I d e n t i f i c a c i o n I D ( F K ) N o m b r e A p e l l i d o e m a i l C a r g o I D ( F K ) D i r e c c i o n C a s a D i r e c c i o n T r a b a j o T e l e f o n o T r a b a j o T e l e f o n o c a s a N u m e r o H i j o s I n d C o n y u g u e T r a b a j a F e c h a N a c i m i e n t o P a s a t i e m p o I D ( F K ) T i p o I n g r e s o I D ( F K ) A n t i g u e d a d L a b o r a l I D ( F K ) S e x o I D ( F K ) E s t a d o C i v i l I D ( F K ) N i v e l E d u c a t i v o I D ( F K ) E s t r a t o S o c i a l I D ( F K ) T i p o V i v i e n d a I D ( F K ) M u l t i p l i c a d o r I n g r e s o I D ( F K ) E s t a d o C l i e n t e I D ( F K )
E m p r e s a
E m p r e s a I D ( F K )
I d e n t i f i c a c i o n D i r e c c i o n T e l e f o n o E m p r e s a D e s c P a g i n a W e b C o d i g o E m p r e s a C a l i f i c a c i o n I D ( F K ) T a m a o I D ( F K ) I n d E m p r e s a R e c o n o c i d a N a t u r a l e z a J u r i d i c a I D ( F K ) R a n g o A v i s o s D i r e c t o I D ( F K ) T i p o N o m i n a I D ( F K ) A c t i v i d a d E c o n o m i c a I D ( F K ) I n d I n d u s t r i a y C o m e r c i o R a n g o S a l a r i o P r o m e d i o A d m o n I D ( F K ) R a n g o S a l a r i o P r o m e d i o O p I D ( F K ) I n g r e s o E m p l e a d o I D ( F K ) R a n g o N u m e r o E m p l e a d o s I D ( F K ) F e c h a I n i c i o F e c h a F i n
A c t i v i d a d L a b o r a l
A c t i v i d a d L a b o r a l I D
A c t i v i d a d L a b o r a l D e s c
A l e r t a
A l e r t a I D
A l e r t a D e s c
A n t i g u e d a d
A n t i g u e d a d I D
A n t i g u e d a d D e s c
C a l i f i c a c i o n d e C l i e n t e s
C a l i f i c a c i o n C l i e n t e I D
C a l i f i c a c i o n C l i e n t e D e s
C a u s a l R e t i r o
C a u s a l R e t i r o I D
C a u s a l R e t i r o D e s c
C l a s i fi c a c i o n C o m e r c i a l
C l a s i f i c a c i o n C o m e r c i a l I D
C l a s i f i c a c i o n C o m e r c i a l D e s c
C l i e n t e
C l i e n t e I D
T i p o C l i e n t e I D ( F K ) I n d C l i e n t e N u e v o T i p o R e l a c i o n I D ( F K ) I n d V e h i c u l o I n d P r o p i e d a d R a i z I n d C a m a r a C o m e r c i o I n d C l i e n t e B u e n o P e r fi l R i e s g o I D ( F K ) A n t i g u e d a d I D ( F K ) E s t a d o A s o c i a d o I D ( F K ) C l a s i fi c a c i o n C o m e r c i a l I D ( F K ) E s t a d o C l i e n t e I D ( F K ) C a u s a l R e t i r o I D ( F K ) C a l i f i c a c i o n C l i e n t e I D ( F K ) A c t i v i d a d L a b o r a l I D ( F K ) T i p o A s o c i a d o I D ( F K ) A g e n c i a I D ( F K ) C a l i f i c a c i o n C o n f i a r I D ( F K ) F e c h a I n i c i o F e c h a F i n A l e r t a I D ( F K ) E n t i d a d I n f o r m a n t e I D ( F K ) E n t i d a d F i n a n c i e r a I D ( F K ) E m p r e s a I D ( F K ) P e r s o n a I D ( F K ) T i p o L o c a l I D ( F K ) T i p o C u e n t a I D ( F K ) B i e n e s I D ( F K ) C l a s i fi c a c i o n M e r c a d e o I D ( F K )
E s t a d o A s o c i a d o
E s t a d o A s o c i a d o I D
E s t a d o A s o c i a d o D e s c
E s t a d o C l i e n t e
E s t a d o C l i e n t e I D
E s t a d o C l i e n t e D e s
P e r f i l R i e s g o
P e r f i l R i e s g o I D
P e r f i l R i e s g o D e s c T i p o R e l a c i o n
T i p o R e l a c i o n I D
T i p o R e l a c i o n D e s c
T i p o C l i e n t e
T i p o C l i e n t e I D
T i p o C l i e n t e D e s c
T i p o A s o c i a d o
T i p o A s o c i a d o I D
T i p o A S s o c i a d o D e s c A g e n c i a
A g e n c i a I D
C l a s e A g e n c i a I D ( F K ) C i u d a d I D ( F K ) C o d i g o A g e n c i a A g e n c i a D e s c F e c h a i n i c i o F e c h a F i n
C a l i f i c a c i o n C o n fi a r
C a l i f i c a c i o n C o n f i a r I D
C a l i f i c a c i o n C o n f i a r D e s
E s t a d o C l i e n t e I D ( F K ) T i p o C o n t r a t o I D ( F K ) C i u d a d L a b o r a l I D ( F K ) C i u d a d R e s i d e n c i a I D ( F K ) I n d C r e d i t o P r o v e e d o r e s P e r s o n a s a C a r g o I D ( F K ) F e c h a I n i c i o F e c h a F i n E m p r e s a I D ( F K ) P r o fe s i o n I D ( F K )
A l e r t a C l i e n t e
A l e r t a I D ( F K )
T i p o C u e n t a
T i p o C u e n t a I D
T i p o C u e n t a D e s c E n t i d a d I n fo r m a n t e
E n t i d a d I n f o r m a n t e I D
E n t i d a d I n f o r m a n t e D e s c T i p o L o c a l
T i p o L o c a l I D
T i p o L o c a l D e s c
E n t i d a d F i n a n c i e r a
E n t i d a d F i n a n c i e r a I D
E n t i d a d F i n a n c i e r a D e s c
F e c h a F i n T i p o R i e s g o I D ( F K ) C a l i f i c a c i o n E m p r e s a s I D ( F K ) T i p o C o n v e n i o I D ( F K ) T i p o A l i a n z a I D ( F K ) E n t i d a d P r e p a g o s I D ( F K ) E n t i d a d P r e p a g a d I D ( F K ) F u e r z a I D ( F K ) I n d C o n v e n i o
B i e n e s
B i e n e s I D
B i e n e s D e s c
C l a s i f i c a c i n M e r c a d e o
C l a s i f i c a c i o n M e r c a d e o I D
C l a s i f i c a c i o n M e r c a d e o D e s c
Llevanelmodelodenegociosal
d l f d d modelofsicodedatos
P e rs o n a
P e rs o n a ID
N u m e ro I d e n ti fi c a c i o n
T i p o Id e n ti fi c a c i o n ID (F K )
N o m b re
A p e l l i d o
e m a i l
E m p re s a
E m p re s a I D ( F K )
I d e n ti fi c a c i o n
D i re c c i o n
T l f C a rg o I D ( F K )
D i re c c i o n C a s a
D i re c c i o n T ra b a j o
T e l e fo n o T ra b a j o
T e l e fo n o c a s a
N u m e ro H i j o s
In d C o n y u g u e T ra b a j a
F e c h a N a c i m i e n t o
P a s a ti e m p o ID ( F K )
T i p o In g re s o ID (F K )
A n ti g u e d a d L a b o ra l I D (F K )
S e x o ID (F K )
E s ta d o C i vi l ID (F K )
N i ve l E d u c a ti vo ID (F K )
E s tra to S o c i a l I D (F K )
T i p o V i vi e n d a I D (F K )
M u l t i p l i c a d o rI n g re s o I D ( F K )
E s ta d o C l i e n te ID (F K )
T i p o C o n tra t o I D (F K )
C i u d a d L a b o ra l ID (F K )
C i u d a d R e s i d e n c i a ID ( F K )
T e l e fo n o
E m p re s a D e s c
P a g i n a W e b
C o d i g o E m p re s a
C a l i fi c a c i o n ID (F K )
T a m a o I D ( F K )
I n d E m p re s a R e c o n o c i d a
N a t u ra l e z a J u ri d i c a ID (F K )
R a n g o A vi s o s D i re c to I D ( F K )
T i p o N o m i n a I D (F K )
A c t i vi d a d E c o n o m i c a ID (F K )
I n d I n d u s tri a y C o m e rc i o
R a n g o S a l a ri o P ro m e d i o A d m o n I D (F K )
R a n g o S a l a ri o P ro m e d i o O p I D (F K )
I n g re s o E m p l e a d o ID (F K )
R a n g o N u m e ro E m p l e a d o s ID (F K )
F e c h a In i c i o
F e c h a F i n
T i p o R i e s g o I D ( F K )
C a l i fi c a c i o n E m p re s a s ID (F K )
T i p o C o n ve n i o ID ( F K )
A c ti vi d a d L a b o ra l
A c ti vi d a d L a b o ra l I D
A c ti vi d a d L a b o ra l D e s c
C a l i fi c a c i o n d e C l i e n te s
C a l i fi c a c i o n C l i e n te ID
C a l i fi c a c i o n C l i e n te D e s
C a u s a l R e ti ro
C a u s a l R e ti ro ID
C a u s a l R e ti ro D e s c
C l i e n t e
C l i e n t e I D
T i p o C l i e n te I D ( F K )
I n d C l i e n t e N u e vo
T i p o R e l a c i o n ID (F K )
I n d V e h i c u l o
I d P i d d R i E t d C l i t
T i p o C l i e n te
T i p o C l i e n te I D
T i p o C l i e n te D e s c
C i u d a d R e s i d e n c i a ID ( F K )
In d C re d i to P ro ve e d o re s
P e rs o n a s a C a rg o I D (F K )
F e c h a In i c i o
F e c h a F i n
E m p re s a ID (F K )
P ro fe s i o n ID (F K )
p ( )
T i p o A l i a n z a ID (F K )
E n t i d a d P re p a g o s I D ( F K )
E n t i d a d P re p a g a d I D ( F K )
F u e rz a I D ( F K )
I n d C o n ve n i o
A n ti g u e d a d
A n ti g u e d a d I D
A n ti g u e d a d D e s c
C l a s i fi c a c i o n C o m e rc i a l
C l a s i fi c a c i o n C o m e rc i a l ID
C l a s i fi c a c i o n C o m e rc i a l D e s c
I n d P ro p i e d a d R a i z
I n d C a m a ra C o m e rc i o
I n d C l i e n t e B u e n o
P e rfi l R i e s g o I D (F K )
A n ti g u e d a d I D ( F K )
E s ta d o A s o c i a d o ID (F K )
C l a s i fi c a c i o n C o m e rc i a l ID (F K )
E s ta d o C l i e n t e I D (F K )
C a u s a l R e ti ro ID (F K )
C a l i fi c a c i o n C l i e n te ID ( F K )
A c ti vi d a d L a b o ra l I D ( F K )
T i p o A s o c i a d o ID (F K )
A g e n c i a I D ( F K )
C a l i fi c a c i o n C o n fi a rID ( F K )
F e c h a I n i c i o
F e c h a F i n
A l e rt a I D (F K )
E n ti d a d In fo rm a n t e I D (F K )
E n ti d a d F i n a n c i e ra I D (F K )
E m p re s a I D (F K )
P e rs o n a ID ( F K )
E s ta d o C l i e n te
E s ta d o C l i e n te ID
E s ta d o C l i e n te D e s
P e rfi l R i e s g o
P e rfi l R i e s g o ID
P e rfi l R i e s g o D e s c
T i p o R e l a c i o n
T i p o R e l a c i o n I D
T i p o R e l a c i o n D e s c
T i p o A s o c i a d o
T i p o A s o c i a d o I D
T i p o A S s o c i a d o D e s c A g e n c i a
A g e n c i a I D
C l a s e A g e n c i a I D (F K )
C i u d a d I D (F K )
C o d i g o A g e n c i a
A g e n c i a D e s c
F e c h a i n i c i o
F e c h a F i n
C a l i fi c a c i o n C o n fi a r
C a l i fi c a c i o n C o n fi a rI D
C a l i fi c a c i o n C o n fi a rD e s
T i p o C u e n ta
T i p o C u e n ta I D
T i p o C u e n ta D e s c E n ti d a d In fo rm a n t e
E n ti d a d In fo rm a n t e I D
T i p o L o c a l
A l e rt a
A l e rt a I D
A l e rt a D e s c
( )
T i p o L o c a l ID (F K )
T i p o C u e n ta I D ( F K )
B i e n e s I D (F K )
C l a s i fi c a c i o n M e rc a d e o ID (F K )
E s ta d o A s o c i a d o
E s ta d o A s o c i a d o I D
E s ta d o A s o c i a d o D e s c
A l e rt a C l i e n te
A l e rt a I D (F K )
E n ti d a d In fo rm a n t e D e s c
T i p o L o c a l
T i p o L o c a l ID
T i p o L o c a l D e s c
E n ti d a d F i n a n c i e ra
E n ti d a d F i n a n c i e ra ID
E n ti d a d F i n a n c i e ra D e s c
B i e n e s
B i e n e s ID
B i e n e s D e s c
C l a s i fi c a c i n M e rc a d e o
C l a s i fi c a c i o n M e rc a d e o I D
C l a s i fi c a c i o n M e rc a d e o D e s c
Sehacenecesarioidentificarcules
d d ll l datospuedenllevarsealDW
En dnde se encuentran los datos? Endndeseencuentranlosdatos?
Basesdedatosinternas
BasesdedatosExternas
Culessonlastransformacionesnecesarias
parallevarlosdatos? p
Cmoseencuentranlosdatos?
Limpieza (data cleansing) Limpieza(datacleansing)
Criba(seleccin)dedatos
Volmen de datos Volmendedatos
Apartirdelmodelofsicose
f l especificanlosprocesos
Extraccin Tomando los datos de las fuentes Extraccin.Tomandolosdatosdelasfuentes
Transformacin.Ajustesalosdatosparaque
sean definidos segn el modelo fsico seandefinidossegnelmodelofsico
Carga.CargadedatosenelDW
LIMPIEZADEDATOS
Lasconsultassondefinidasy
f d especificadastcnicamente
Definicindeconsultas
d f d l d predefinidasanivelde
dimensionesymtricas
CubosoDisponibilidadde
d t i d
Qu paso?
Por qu Paso?
Qu pasar?
datosparageneracinde
consultasadhod
Definicindeconsultas
estticas como complemento
Qu pasar?
Cmo hago que pase?
estticascomocomplemento
enimplementacinmixta
Mineradedatos
IMPLEMENTACION DE CONSULTAS EXITOSAS
Las pruebas minimizan los riesgos Laspruebasminimizanlosriesgos
Comocualquiersolucinlaimplementacindeunabodegadedatosdebe
ser probada serprobada
Lacalidaddelosdatosesvitalparaunabuenaimplementacin
Unabodegadedatosdebeserconfiable
Lainformacinalmacenadaenlabodegadedatosdebeserrelevante g
Ladisponibilidaddelosdatosenlabodegadedatosdebeestaracordealos
lineamientosdelaorganizacin
Sedebegarantizarquelaintegracindelosdatosesprecisaycompleta
Los recursos necesarios para el uso de la bodega de datos son claves para Losrecursosnecesariosparaelusodelabodegadedatossonclavespara
elxitodelproceso
Lainformacindebeestardisponiblesegnelplandefinido
Losprocesosdeextraccin,transformacinycargadebenserprobados p y g p
Debemos partir de la historia Debemospartirdelahistoria
Cargas histricas El proceso de cargar la Cargashistricas.Elprocesodecargarla
informacinhistricaesunodelospilaresdel
inicio de la bodega de datos iniciodelabodegadedatos
El proceso apenas inicia Elprocesoapenasinicia
Tiene sentido tener una bodega de datos sin Tienesentidotenerunabodegadedatossin
actualizar?
Qu tan frecuente se debe actualizar? Qutanfrecuentesedebeactualizar?
Sedebenactualizarlosdatososedeben
l ? reemplazar?
Cmo ha sido el avance de DW? CmohasidoelavancedeDW?
Miles de organizaciones alrededor del mundo Milesdeorganizacionesalrededordelmundo
hoytienenlafortunadetomarsusdecisiones
basados en el conocimiento a partir de la basadosenelconocimientoapartirdela
implementacindesusbodegasdedatos
En Colombia desde grandes hasta pequeas EnColombia,desdegrandeshastapequeas
empresasestnobteniendolosmejores
resultados despus de haber implementado resultadosdespusdehaberimplementado
subodegadedatos
Preguntas Preguntas

You might also like