Professional Documents
Culture Documents
?
Informacin para la toma de decisiones
Islas de Informacin
Qu es un Data Warehouse?
Data Warehouse
DATOS OPERACIONALES BATCH
METADATOS
SOPORTE DE DECISIN
Transfor_ macin
DATOS EXTERNOS
DATA WAREHOUSE
Caractersticas
5 5 5 5
Arquitectura
20 10 0 1 2 3 S1 Serie1 Serie2
DATOS OPERACIONALES
DATOS EXTERNOS
Metadatos
DATA WAREHOUSE
PROCESOS Y FUNCIONES
Metadatos
5 5
Datos acerca de los datos. Herramienta que almacena datos u otro punto de apoyo para los sistemas de informacin, guardando la pista de las relaciones entre el Data Warehouse y las Bases de Datos Operacionales, incluyendo adems los pasos requeridos para el almacenamiento de los datos. Se clasifican en: Metadatos de Transformacin, y Metadatos de Aplicacin.
Metadatos
DATA WAREHOUSE
5 5 5 5
Tablas de Estructura del Data Warehouse Tabla de Atributos del Data Warehouse Datos de origen del Data Warehouse (El sistema de registros) El mapeo desde los sistemas de registros hasta el Data Warehouse. La especificacin de los Modelos de Datos. La extraccin y el registro Las rutinas de acceso a los datos Las equivalencias de tipos de datos entre Base de Datos Fuente y Destino.
Anlisis Multidimensional
5Cliente 5Geografa
5Tiempo
5Cliente
5Geografa
5Producto
5Producto
5Tiempo
5DIMENSIONES
5Mes 5Da 5Trim
5INTERRELACIONES
5Ao
Pivote
5Ao
Fiscal
5JERARQUIAS
Tipos
5 OLAP
Modelos
5 Modelo
Clave: Producto Atributos de Tiempo Clave: Tiempo Clave: Regin Atributos de Terminal Clave: Terminal Volumen Final Volumen Despachado
Atributos de Producto
Atributos de Regin
Esta tcnica consiste en extraer informacin de grandes bases de datos en funcin de estos mismos. Se trata de un proceso automatizado de presentacin de patrones, normas o funciones a un usuario informado para su revisin y estudio. Procesos de Minera de Datos
5 5 5 5
Necesidades de Desarrollo
Transformar Definir
DB2 INFORMIX
Distribuir
Automatizar
ORACLE
SQL Server
SYBASE
VSAM IMS
Files
Herramientas
Herramientas de Modelamiento de datos 5 Herramientas de Construccin de un Data Warehouse 5 Herramientas de anlisis multidimensional u OLAP, Consultas y reportes 5 Minera de Datos
5
5Proceso:
actividad de la organizacin soportada por un OLTP del cual se puede extraer informacin con el propsito de construir el almacn de datos.
5Pedidos
5Compras
Cadena de supermercados.
5Cadena
de supermercados con 300 almacenes en la que se expenden unos 30.000 productos distintos.
5Actividad: 5La
Ventas.
El grnulo define el nivel atmico de datos en el almacn de datos. El grnulo determina el significado de las tuplas de la tabla de hechos. El grnulo determina las dimensiones bsicas del esquema
Dimensin 1
m1 i D
de hechos
5id_dim1 5id_dim2 5id_dim3
5D
im
5tabla
Dimensin 3
5tabla
Dimensin 2
m2 i 5D
5D
im
5tabla
Dimensin n
Cadena de supermercados.
se desea almacenar informacin sobre las ventas diarias de cada producto en cada almacn de la cadena.
5Grnulo: define
el significado de las tuplas de la tabla de hechos. las dimensiones bsicas del esquema.
5producto 5da 5almacn
5
determina
t uc d ro 5p o
em 5 ti o
ac m l a n
5ventas
Dimensiones: dimensiones que caracterizan la actividad al nivel de detalle (grnulo) que se ha elegido.
5Tiempo 5Producto 5Almacn 5Cliente
(dimensin temporal: cundo se produce la actividad?) (dimensin cul es el objeto de la actividad?) (dimensin geogrfica: dnde se produce la actividad?) (dimensin quin es el destinatario de la actividad?)
De cada dimensin se debe decidir los atributos (propiedades) relevantes para el anlisis de la actividad. Entre los atributos de una dimensin existen jerarquas naturales que deben ser identificadas (da-mes-ao)
Cadena de supermercados.
5tiemp
5definicin
5dimensione
de grnulo
s bsicas
o 5product o 5establecimiento
5Nota:
22
informacin (sobre la actividad) que se desea almacenar en cada tupla de la tabla de hechos y que ser el objeto del anlisis.
5Precio 5Unidades 5Importe 5....
5Nota:
algunos datos que en el OLTP coincidiran con valores de atributos de dimensiones, en el almacn de datos pueden representar hechos. (Ejemplo: el precio de venta de un producto).
Cadena de supermercados.
se desea almacenar informacin sobre las ventas diarias de cada producto en cada establecimiento de la cadena.
Costo total de las ventas del producto en el da Nmero total de unidades vendidas del producto en el da Nmero total de clientes distintos que han comprado el producto en el da.
Conclusiones
5
La informacin en un sistema operacional se encuentra detallada registro por registro, mientras que la informacin en un Data Warehouse esta resumida, transformada, depurada y lista para la toma de decisiones. Con la construccin de un Data Warehouse los ejecutivos descubren que requieren informacin ms precisa y rpida que antes.