You are on page 1of 29

31/07/2013

Diseos de BD
Minaya BENDEZU RAMOS
1
Administracin de las Tecnologas de la Informacin

31/07/2013

Diseo Conceptual

Administracin de las Tecnologas de la Informacin

Diseo Lgico

31/07/2013

Administracin de las Tecnologas de la Informacin

31/07/2013

Diseo Fsico

Administracin de las Tecnologas de la Informacin

Alumnos:

Bendezu Llanos, Luz Milagros Minaya Arroyo, Cristhian Ramos Tineo, Manuel Villarreal Parra, Jean Carlos Valverde Gonzales, Carlos

Data Warehouse

Ing. Sistemas y Computacin UPLA

DATA MART
Mercado de Datos

31/07/2013

DATAMART
Un Datamart es una base de datos departamental, especializada en el almacenamiento de los datos de un rea de negocio especfica.

Se caracteriza por disponer la estructura ptima de datos para analizar la informacin al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento.

Ing. Sistemas y Computacin UPLA

8 8

31/07/2013

Data Mart

Puede ser alimentado desde los datos de un DWH, o integrar por si mismo un compendio de distintas fuentes de informacin. Necesidad de datos seleccionados, enfatizando el fcil acceso a una informacin relevante.

Ing. Sistemas y Computacin UPLA

31/07/2013

Beneficios
Dar a los usuarios acceso a los datos que ellos necesitan para analizarlo ms a menudo. Extender a la toma de decisiones estratgicas, para obtener grandes beneficios, incrementa el entendimiento de operaciones con sus negocios reduce el tiempo que consume estas tareas

Ing. Sistemas y Computacin UPLA

10

31/07/2013

Fases :
Construccin de DM Construccin de los procesos de cargas Construccin de los reportes analticos Construccin de los procesos de prueba

Ing. Sistemas y Computacin UPLA

11

31/07/2013

Data Mart Vs. Data Warehousing


Data Mart satisface la necesidades de un departamento construidos por datos. agregados y resumidos. datos recientes. los usuarios son recolectores de informacin. Data Warehousing satisface las necesidades de una corporacin. datos con detalles ms amplios. datos histricos. son exploradores de la informacin.

Ing. Sistemas y Computacin UPLA

12

31/07/2013

Data Warehouses Vs. Data Marts


Data Warehouse
Propiedad Alcance Tema Fuente de datos

Data Mart

Data Warehouse Empresarial

Data Mart
Departamental Un solo tema Pocos <

Mltiples
Muchas 100 GB to > 1 TB

Tamao (tpico)

100 GB Meses

Tiempo de implementacin

Meses a aos

Ing. Sistemas y Computacin UPLA

DATA WAREHOUSE
Almacn de Datos

13

14

31/07/2013

Objetivos

Hacer la informacin de la organizacin accesible Hacer a la informacin de la organizacin consistente Controlar el acceso efectivo a los datos Generar informacin de manera flexible Servir de ayuda a la toma de decisiones

Un Data Warehouse tiene como objetivo almacenar y proveer a la Organizacin de informacin relevante y a tiempo

Ing. Sistemas y Computacin UPLA

15

31/07/2013

Caractersticas de un Data Warehouse

Orientado a un tema Administra grandes cantidades de informacin Guarda informacin en diversos medios de almacenamiento Comprende mltiples versiones de uno (o varios) esquema de base de datos Condensa y agrega informacin Integra y asocia informacin de muchas fuentes
Ing. Sistemas y Computacin UPLA

16

31/07/2013

Empresas que usan DATA WAREHOUSE


Royal

bank of canada PayPal 3M Coca-Cola Company Verizon Ford Motor Company

Ing. Sistemas y Computacin UPLA

Flujo de Datos de un DW
Production systems
CRM DataWarehouse Billing OLAP cubes

Querying & Reporting tools

Business Users

Activation systems

ETL Other sources


Other DBs

Datamarts

Files Acquisition Storage / Archiving Restitution


17

18

31/07/2013

Diferencias
SISTEMAS TRADICIONALES Predomina la actualizacin. Actividad operativa (da a da). Proceso puntual. Estabilidad. Datos desagregados. Dato actual. Respuesta de la transaccin inmediata. Estructura relacional. Usuarios de perfiles bajos. Explotacin de la informacin relacionada con operatividad de cada aplicacin DATAWAREHOUSE Predomina la consulta Anlisis y decisin estratgica. Proceso masivo. Dinamismo. Niveles de detalle/agregacin. Dato histrico. Respuesta masiva Estructura Multidimensional Usuarios de perfiles altos. Explotacin de informacin interna y externa relacionada con el negocio.

Ing. Sistemas y Computacin UPLA

DATA MINING

Minera de Datos

Minera de Datos

19

20

31/07/2013

Que es un Data Mining?

El data mining es el conjunto de tcnicas y tecnologas que permiten explorar grandes BBDD, de manera automtica o semiautomtica, con el objetivo de encontrar reglas que expliquen el comportamiento de los datos en un determinado contexto.

Ing. Sistemas y Computacin UPLA

21

31/07/2013

Propsito
Descubrir, extraer y almacenar informacin relevante de amplias base de datos. Permite descubrir patrones, perfiles y tendencias a travs del anlisis de datos. Extraccin de informacin a partir de datos (se asemeja a la minera se cava para conseguir informacin relevante).

Ing. Sistemas y Computacin UPLA

22

31/07/2013

Fases:

Filtrado de datos: eliminar valores incorrectos y no vlidos, de la fuente de una base de datos, data warehouse, segn las necesidades y el algoritmo que se utilizar. Seleccin de variables: la seleccin de caractersticas, elige las variables ms influyentes en el problema, sin sacrificar la calidad del modelo de conocimiento obtenido por la minera. Extraccin del conocimiento: patrones de comportamiento observados en los valores de las variables del problema.

Ing. Sistemas y Computacin UPLA

23

31/07/2013

Mtodos:
Basados

en los mejores atributos del problema. Variables independientes mediante test de sensibilidad algortmica de distancias o heursticos. Interpretacin y evaluacin: las conclusiones son vlidas y satisfactorias.

Ing. Sistemas y Computacin UPLA

24

31/07/2013

Relacin
Relacin con el Data Mining Est asociado al escaln ms alto de la pirmide (Nivel Estratgico) y tiene por objeto eliminar los errores cometidos por las personas al analizar los datos debido a prejuicios y dejar que sean los datos los que muestren los modelos subyacentes en ellos.
Mientras en Data Warehousing, se basan en estructuras multidimensionales, en las que se almacena la informacin calculando previamente todas las combinaciones de todos los niveles de todas las aperturas de anlisis. Aunque este mtodo se puede considerar como exagerado, nunca ser tan caro, como lo que le costara a la organizacin el tomar las decisiones equivocadas. Ing. Sistemas y Computacin
UPLA

25

31/07/2013

Data Mining un proceso


Pasos

Ing. Sistemas y Computacin UPLA

Software

26

31/07/2013

Software paga: Miner de SAS Clementine de SPSS IBM STATISTICA Oracle Data Mining Matlab

Software libre: rapid miner Orange R Weka

Ing. Sistemas y Computacin UPLA

27

31/07/2013

Nota
Permite agrupar clientes de acuerdo a su comportamiento de manera que entre ellos se asemejen entre si y se diferencien. De esta manera se prepararn ofertas y servicios personalizados. Ahora es posible generar y almacenar datos dentro de sus sistemas para que ms adelante se puedan utilizar la informacin. Importante: Para un experto no son los datos en si los ms relevantes sino la informacin que encierra sus relaciones, fluctuaciones o dependencias.

Ing. Sistemas y Computacin UPLA

28

31/07/2013

Administracin de las Tecnologas de la Informacin

29

31/07/2013

Muchas gracias!!

You might also like