You are on page 1of 26

SISTEMAS DE APOYO A LA TOMA DE DECISIONES.

INGRID PAOLA MORENO PARRA KRISBEL CRISTINA RANGEL DIAZ

Por qu Data Warehouse ?


Datos Datos Datos Datos Datos Datos Datos Datos Datos Datos

?
Informacin para la toma de decisiones

Islas de Informacin

Qu es un Data Warehouse?

Data Warehouse nos permite la


integracin de datos corporativos en un nico depsito donde los usuarios puedan consultar o analizar los datos para la toma de decisiones.

Data Warehouse
DATOS OPERACIONALES BATCH

DATOS OPERACIONALES TRANSACCIONALES

METADATOS

SOPORTE DE DECISIN

Transfor_ macin
DATOS EXTERNOS

DATA WAREHOUSE

Caractersticas
5 5 5 5

Tema Orientado Integrado Variante en el tiempo No Voltil

Arquitectura

20 10 0 1 2 3 S1 Serie1 Serie2

DATOS OPERACIONALES

DATOS EXTERNOS

CONSULTAS Y REPORTES INTERACTIVOS

MINERIA DE DATOS SEGMENTACION PREDICCION

ANALISIS MULTIDIMENSIONAL O ANALISIS OLAP

Extraccin , limpieza transformacin y carga

Metadatos

DATA WAREHOUSE
PROCESOS Y FUNCIONES

Metadatos
5 5

Datos acerca de los datos. Herramienta que almacena datos u otro punto de apoyo para los sistemas de informacin, guardando la pista de las relaciones entre el Data Warehouse y las Bases de Datos Operacionales, incluyendo adems los pasos requeridos para el almacenamiento de los datos. Se clasifican en: Metadatos de Transformacin, y Metadatos de Aplicacin.

Metadatos

DATA WAREHOUSE

Contenido de los Metadatos


5 5 5

5 5 5 5

Tablas de Estructura del Data Warehouse Tabla de Atributos del Data Warehouse Datos de origen del Data Warehouse (El sistema de registros) El mapeo desde los sistemas de registros hasta el Data Warehouse. La especificacin de los Modelos de Datos. La extraccin y el registro Las rutinas de acceso a los datos Las equivalencias de tipos de datos entre Base de Datos Fuente y Destino.

Anlisis Multidimensional

5Cliente 5Geografa

5Tiempo

5Cliente

5Geografa

5Producto

5Producto

5Tiempo

5DIMENSIONES
5Mes 5Da 5Trim

5INTERRELACIONES

Rebanar/Picar Navegacin Profundizacin y resumen Clculos Resmenes y adiciones 5SERVICIOS

5Ao

Pivote
5Ao

Fiscal

5JERARQUIAS

Anlisis Multidimensional OLAP


OLAP es una tecnologa de procesamiento analtica que crea nueva informacin empresarial a partir de los datos existentes, por medio de un rico conjunto de transformaciones empresariales y clculos numricos.

Tipos y Modelos de OLAP


5

Tipos
5 OLAP

Relacional (ROLAP) 5 OLAP Multidimensional (MOLAP) 5 OLAP Hbrida (HOLAP)


5

Modelos
5 Modelo

Cubo 5 Esquema Estrella 5 Esquema Copo de Nieve 5 Esquema Mixto

Tipos y Modelos de OLAP


Esquema Estrella
Tabla de Volmenes

Clave: Producto Atributos de Tiempo Clave: Tiempo Clave: Regin Atributos de Terminal Clave: Terminal Volumen Final Volumen Despachado

Atributos de Producto

Atributos de Regin

Minera de Datos (Data Mining)


5

Esta tcnica consiste en extraer informacin de grandes bases de datos en funcin de estos mismos. Se trata de un proceso automatizado de presentacin de patrones, normas o funciones a un usuario informado para su revisin y estudio. Procesos de Minera de Datos
5 5 5 5

Seleccin de Datos Transformacin de Datos Data Mining Interpretacin de resultados

Esquema Data Warehousing


Consultas y Reportes Procesamiento Analtico en Lnea OLAP Minera de Datos Acceso WEB

Necesidades del Negocio Data Warehouse (Data Mart)


Acceso Almacenar Manejar

Necesidades de Desarrollo

Transformar Definir
DB2 INFORMIX

Distribuir

Automatizar

ORACLE

SQL Server

SYBASE

VSAM IMS

Files

Datos Fuentes externos y operacionales

Herramientas
Herramientas de Modelamiento de datos 5 Herramientas de Construccin de un Data Warehouse 5 Herramientas de anlisis multidimensional u OLAP, Consultas y reportes 5 Minera de Datos
5

Diseo de un Almacn de Datos


5Paso

1. Elegir un proceso de la organizacin para modelar.

5Proceso:

actividad de la organizacin soportada por un OLTP del cual se puede extraer informacin con el propsito de construir el almacn de datos.
5Pedidos

(de clientes) (a suministradores)

5Compras

5Facturacin 5Envos 5Ventas 5Inventario 5

Diseo de un Almacn de Datos


5Ejemplo:

Cadena de supermercados.

5Cadena

de supermercados con 300 almacenes en la que se expenden unos 30.000 productos distintos.

5Actividad: 5La

Ventas.

actividad a modelar son las ventas de productos en los almacenes de la cadena.

Diseo de un Almacn de Datos


5Paso

2. Decidir el grnulo (nivel de detalle) de representacin.


5Grnulo:

es el nivel de detalle al que se desea almacenar informacin sobre la actividad a modelar.


El grnulo define el nivel atmico de datos en el almacn de datos. El grnulo determina el significado de las tuplas de la tabla de hechos. El grnulo determina las dimensiones bsicas del esquema

transaccin en el OLTP informacin diaria informacin semanal informacin mensual. ....

Diseo de un Almacn de Datos


5tabla 5tabla

Dimensin 1

m1 i D

de hechos
5id_dim1 5id_dim2 5id_dim3

5D

im

5tabla

Dimensin 3

5tabla

Dimensin 2

m2 i 5D

5... 5id_dim 5.... 5(hechos)

5D

im

5tabla

Dimensin n

Diseo de un Almacn de Datos


5Ejemplo:
5Grnulo:

Cadena de supermercados.

se desea almacenar informacin sobre las ventas diarias de cada producto en cada almacn de la cadena.
5Grnulo: define

el significado de las tuplas de la tabla de hechos. las dimensiones bsicas del esquema.
5producto 5da 5almacn
5

determina

t uc d ro 5p o

em 5 ti o

ac m l a n

5ventas

Diseo de un Almacn de Datos


5Paso

3. Identificar las dimensiones que caracterizan el proceso.

Dimensiones: dimensiones que caracterizan la actividad al nivel de detalle (grnulo) que se ha elegido.
5Tiempo 5Producto 5Almacn 5Cliente

(dimensin temporal: cundo se produce la actividad?) (dimensin cul es el objeto de la actividad?) (dimensin geogrfica: dnde se produce la actividad?) (dimensin quin es el destinatario de la actividad?)

De cada dimensin se debe decidir los atributos (propiedades) relevantes para el anlisis de la actividad. Entre los atributos de una dimensin existen jerarquas naturales que deben ser identificadas (da-mes-ao)

Diseo de un Almacn de Datos


5Ejemplo:

Cadena de supermercados.
5tiemp

5definicin

5dimensione

de grnulo

s bsicas

o 5product o 5establecimiento

5Nota:

En las aplicaciones reales el nmero de dimensiones suele variar entre 3 y 15 dimensiones.

22

Diseo de un Almacn de Datos


5Paso

4. Decidir la informacin a almacenar sobre el proceso.


5Hechos:

informacin (sobre la actividad) que se desea almacenar en cada tupla de la tabla de hechos y que ser el objeto del anlisis.
5Precio 5Unidades 5Importe 5....

5Nota:

algunos datos que en el OLTP coincidiran con valores de atributos de dimensiones, en el almacn de datos pueden representar hechos. (Ejemplo: el precio de venta de un producto).

Diseo de un Almacn de Datos


5Ejemplo:
5Grnulo:

Cadena de supermercados.

se desea almacenar informacin sobre las ventas diarias de cada producto en cada establecimiento de la cadena.

Costo total de las ventas del producto en el da Nmero total de unidades vendidas del producto en el da Nmero total de clientes distintos que han comprado el producto en el da.

Conclusiones
5

La informacin en un sistema operacional se encuentra detallada registro por registro, mientras que la informacin en un Data Warehouse esta resumida, transformada, depurada y lista para la toma de decisiones. Con la construccin de un Data Warehouse los ejecutivos descubren que requieren informacin ms precisa y rpida que antes.

Muchas Gracias por su Atencin

You might also like