Professional Documents
Culture Documents
Tarea 4
Business Intelligence
Instituto IACC
11-11-2018
PROBLEMA
La compañía N & M Ltda. requiere mejorar sus procesos de toma de decisiones, actualmente
posee un sistema ERP que registra la operación diaria de la empresa, esta posee un modelo de
base de datos relacional que almacena las ventas diarias, productos, contabilidad, cobranzas.
Además, utiliza un sistema CRM para gestionar la relación con los clientes. Por otra parte, esta
empresa desea conocer las ventas del año 2013 del departamento de instrumentos musicales.
En primer lugar definiré Data Mart y Data Werehouse para ejemplificar el uso de un Data
Mart respecto de la necesidad de la empresa N & M:
Un Data Mart es una forma sencilla de un Data Warehouse (almacén de datos) que se
centra en un único tema o área funcional, como Ventas o Finanzas o Marketing. Por
esto, se conoce a menudo como base de datos departamental.
Recuperar más rápidamente los datos que necesitan los usuarios finales. De la misma
manera, los análisis realizados sobre un Data Mart son más rápidas y ágiles.
Llevar a cabo un proceso de minería de datos. El data mining genera una gran carga de
trabajo, por lo cual a veces nos puede beneficiar realizar este proceso sobre un Data
Mart, para no afectar el rendimiento del Data Warehouse central.
Modificar datos para simular escenarios de negocios. De esta manera, creamos copias
de los datos en un Data Mart que podemos modificar a nuestro antojo, y esto no
afectará a los datos en el Data Warehouse principal.
2. En el caso presentado se especifica que la empresa N & M Ltda. desea conocer las
ventas del año 2013 del departamento de instrumentos musicales. De acuerdo a esto
distinga las operaciones analíticas como roll-up, drill-down, slice and dice y pivot.
Existen cuatro tipos básicos de operaciones en OLAP para el análisis de datos. Las
operaciones conocidas como “drill down” y “roll up” básicamente van a definir el nivel
de granularidad con la que queremos analizar los datos, mientras que las operaciones
“slice” y “dice” nos permitirán navegar entre las dimensiones.
Las operaciones “drill down” y “roll up” son utilizadas para mover la vista hacia y desde un
mayor nivel de detalle a un menor nivel de detalle. Para cada caso, hacia un mayor nivel de
detalle realizamos un “drill down”, mientras que para un menor nivel de detalle realizamos
un “roll up”. Recordemos que la granularidad de la información es directamente proporcional
al nivel de detalle, por lo que estas operaciones básicamente nos ayudan a ver o analizar los
datos desde diferentes niveles de granularidad.
En el caso de conocer de las ventas año 2013 del departamento de instrumentos musicales,
podemos utilizar un “drill down” ya que se requiere un mayor nivel de detalle.
Slice y Dice:
Las operaciones de Slice (trocear) y dice (dado) se corresponden a las operaciones para la
visualización de los datos a través del cubo.
Slice y Dice son las habilidades para acceder a un data warehouse a través de cualquiera de
sus dimensiones por igual. Las operaciones de Slice y Dice realizan el proceso de separar y
combinar los datos de infinitas maneras.
La operación de Slice realiza un “corte” en el cubo para que los usuarios puedan centrarse
en un área determinada del cubo. También puede decirse que define un subcubo.
Aquí, también podemos centrarnos en el análisis de las ventas del año 2013 de la empresa N
& M, del departamento de instrumentos musicales.
La operación Dice, rota el cubo hasta una nueva perspectiva, para que los usuarios puedan
ver los datos desde diferentes perspectivas en su análisis de los datos.
Con estas operaciones el usuario que analiza la información, puede agruparla de una manera,
analizarla, agruparla de otra y realizar otro análisis. Con las operaciones de Slice y Dice el
usuario posee diferentes perspectivas para el análisis.
Vista Multidimensional:
Los cubos OLAP tienen un número indefinido de dimensiones, razón por la cual también reciben
el nombre de hipercubos. Un cubo OLAP contendrá datos de una determinada variable que se
desea analizar, proporcionando una vista lógica de los datos provistos por el sistema de
información hacia el data warehouse, esta vista estará dispuesta según unas dimensiones y podrá
El análisis de los datos está basado en las dimensiones del hipercubo, por lo tanto, se trata de un
análisis multidimensional.
ROLAP:
OLAP Relacional. Todos los datos, incluyendo las agregaciones se almacenan dentro de una
estructura relacional de base de datos, que puede estar en la misma localización de la fuente o no.
ROLAP es el método de almacenamiento más lento en la recuperación de los datos. ROLAP
tiene sentido en pequeños volúmenes de datos.
MOLAP:
OLAP Multidimensional. En MOLAP, los datos de fuente y las agregaciones son almacenes en
un formato multidimensional. MOLAP es la opción más rápida para la recuperación de datos,
pero requiere de mucho espacio en disco, aunque en nuestros días esto no es un gran problema
debido al bajo precio de almacenamiento.
HOLAP:
OLAP Híbrido. HOLAP es una combinación de las anteriores (MOLAP, ROLAP). Las bases de
datos HOLAP almacenan las agregaciones dentro de una estructura multidimensional, pero el
almacenamiento de los mismos (pre-calculados) se produce de forma relacional. HOLAP ofrece
las funcionalidades de MOLAP, pero es tan lento como ROLAP.
Debido a que los costes de hardware son cada vez más bajos, MOLAP se presenta como la
mejor opción siempre que sea posible el acceso a una base de datos o fuente MOLAP
independiente. Por otro lado ROLAP es más conveniente en el caso de que el número de
consultas sea reducido y el volumen de datos relativamente bajo para esta empresa N & M
Ltda.
BIBLIOGRAFÍA
Contenidos Semana 4.
Recursos Adicionales…