Professional Documents
Culture Documents
Diseos de BD
Minaya BENDEZU RAMOS
1
Administracin de las Tecnologas de la Informacin
31/07/2013
Diseo Conceptual
Diseo Lgico
31/07/2013
31/07/2013
Diseo Fsico
Alumnos:
Bendezu Llanos, Luz Milagros Minaya Arroyo, Cristhian Ramos Tineo, Manuel Villarreal Parra, Jean Carlos Valverde Gonzales, Carlos
Data Warehouse
DATA MART
Mercado de Datos
31/07/2013
DATAMART
Un Datamart es una base de datos departamental, especializada en el almacenamiento de los datos de un rea de negocio especfica.
Se caracteriza por disponer la estructura ptima de datos para analizar la informacin al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento.
8 8
31/07/2013
Data Mart
Puede ser alimentado desde los datos de un DWH, o integrar por si mismo un compendio de distintas fuentes de informacin. Necesidad de datos seleccionados, enfatizando el fcil acceso a una informacin relevante.
31/07/2013
Beneficios
Dar a los usuarios acceso a los datos que ellos necesitan para analizarlo ms a menudo. Extender a la toma de decisiones estratgicas, para obtener grandes beneficios, incrementa el entendimiento de operaciones con sus negocios reduce el tiempo que consume estas tareas
10
31/07/2013
Fases :
Construccin de DM Construccin de los procesos de cargas Construccin de los reportes analticos Construccin de los procesos de prueba
11
31/07/2013
12
31/07/2013
Data Mart
Data Mart
Departamental Un solo tema Pocos <
Mltiples
Muchas 100 GB to > 1 TB
Tamao (tpico)
100 GB Meses
Tiempo de implementacin
Meses a aos
DATA WAREHOUSE
Almacn de Datos
13
14
31/07/2013
Objetivos
Hacer la informacin de la organizacin accesible Hacer a la informacin de la organizacin consistente Controlar el acceso efectivo a los datos Generar informacin de manera flexible Servir de ayuda a la toma de decisiones
Un Data Warehouse tiene como objetivo almacenar y proveer a la Organizacin de informacin relevante y a tiempo
15
31/07/2013
Orientado a un tema Administra grandes cantidades de informacin Guarda informacin en diversos medios de almacenamiento Comprende mltiples versiones de uno (o varios) esquema de base de datos Condensa y agrega informacin Integra y asocia informacin de muchas fuentes
Ing. Sistemas y Computacin UPLA
16
31/07/2013
Flujo de Datos de un DW
Production systems
CRM DataWarehouse Billing OLAP cubes
Business Users
Activation systems
Datamarts
18
31/07/2013
Diferencias
SISTEMAS TRADICIONALES Predomina la actualizacin. Actividad operativa (da a da). Proceso puntual. Estabilidad. Datos desagregados. Dato actual. Respuesta de la transaccin inmediata. Estructura relacional. Usuarios de perfiles bajos. Explotacin de la informacin relacionada con operatividad de cada aplicacin DATAWAREHOUSE Predomina la consulta Anlisis y decisin estratgica. Proceso masivo. Dinamismo. Niveles de detalle/agregacin. Dato histrico. Respuesta masiva Estructura Multidimensional Usuarios de perfiles altos. Explotacin de informacin interna y externa relacionada con el negocio.
DATA MINING
Minera de Datos
Minera de Datos
19
20
31/07/2013
El data mining es el conjunto de tcnicas y tecnologas que permiten explorar grandes BBDD, de manera automtica o semiautomtica, con el objetivo de encontrar reglas que expliquen el comportamiento de los datos en un determinado contexto.
21
31/07/2013
Propsito
Descubrir, extraer y almacenar informacin relevante de amplias base de datos. Permite descubrir patrones, perfiles y tendencias a travs del anlisis de datos. Extraccin de informacin a partir de datos (se asemeja a la minera se cava para conseguir informacin relevante).
22
31/07/2013
Fases:
Filtrado de datos: eliminar valores incorrectos y no vlidos, de la fuente de una base de datos, data warehouse, segn las necesidades y el algoritmo que se utilizar. Seleccin de variables: la seleccin de caractersticas, elige las variables ms influyentes en el problema, sin sacrificar la calidad del modelo de conocimiento obtenido por la minera. Extraccin del conocimiento: patrones de comportamiento observados en los valores de las variables del problema.
23
31/07/2013
Mtodos:
Basados
en los mejores atributos del problema. Variables independientes mediante test de sensibilidad algortmica de distancias o heursticos. Interpretacin y evaluacin: las conclusiones son vlidas y satisfactorias.
24
31/07/2013
Relacin
Relacin con el Data Mining Est asociado al escaln ms alto de la pirmide (Nivel Estratgico) y tiene por objeto eliminar los errores cometidos por las personas al analizar los datos debido a prejuicios y dejar que sean los datos los que muestren los modelos subyacentes en ellos.
Mientras en Data Warehousing, se basan en estructuras multidimensionales, en las que se almacena la informacin calculando previamente todas las combinaciones de todos los niveles de todas las aperturas de anlisis. Aunque este mtodo se puede considerar como exagerado, nunca ser tan caro, como lo que le costara a la organizacin el tomar las decisiones equivocadas. Ing. Sistemas y Computacin
UPLA
25
31/07/2013
Software
26
31/07/2013
Software paga: Miner de SAS Clementine de SPSS IBM STATISTICA Oracle Data Mining Matlab
27
31/07/2013
Nota
Permite agrupar clientes de acuerdo a su comportamiento de manera que entre ellos se asemejen entre si y se diferencien. De esta manera se prepararn ofertas y servicios personalizados. Ahora es posible generar y almacenar datos dentro de sus sistemas para que ms adelante se puedan utilizar la informacin. Importante: Para un experto no son los datos en si los ms relevantes sino la informacin que encierra sus relaciones, fluctuaciones o dependencias.
28
31/07/2013
29
31/07/2013
Muchas gracias!!