You are on page 1of 21

CAPITULO II

ELABORACION DEL PROYECTO

2.1 Justificacin de la Metodologa y Herramientas de


Desarrollo
2.1.1 Justificacin de la Metodologa

2.1.2 Justificacin del uso de la Metodologa de Kimball


Se realizar una comparacin entre las dos metodologas ms importantes que son la
metodologa de Ralph Kimball (y su enfoque dimensional), y la metodologa de Will Inmon
(y su enfoque Empresarial Warehouse) para la construccin de Data.
Warehouse, en el caso de particular de este trabajo de investigacin se analizara desde el
punto de vista de la construccin de un Datamart que es una parte de un Data Warehouse.
Como introduccin a este anlisis podemos mencionar que se tienen otras alternativas
como son la metodologa de Hefesto y The SAS Rapid Data Warehouse Methodology entre
otras que son adaptaciones de las dos principales, adems de metodologas Hibridas
como (el Hybrid DW o el Federated DW, que utilizan una aproximacin intermedia para la
construccin del sistema) que no explicaremos en este documento que son aquellas que
usan en parte Bottom-up y en parte Top-Down. Se debe tomar en cuenta que a la hora de
escoger una metodologa debemos revisar una que se adapte a al tipo de proyecto y
organizacin dentro de la cual nos encontramos, tomando en cuenta particularidades como
tipos de datos que se manejan, la complejidad de los mismos y del modelo relacional,
fuentes de datos, nmero de transacciones, la perspectiva de crecimiento, adems si los
requerimientos de anlisis de informacin son similares en los diferentes departamentos o
no.

2.1.3 Metodologas Libres

Es interesante ver que existen alternativas libres como la que se menciona a continuacin,
adems de haberla mencionado en el prrafo anterior, la metodologa de Hefesto podra ser
vlida para el desarrollo de un proyecto como este, pero se encuentra en un proceso de
desarrollo por lo que no se consider para este proyecto.

Metodologa Hefesto
La Metodologa Hefesto, creada por Bernabeu Ricardo Dario (disponible con licencia
GNU FDL)

[4]

. Esta metodologa es muy realista y pragmtica (no se enfoca en un

excesivo nmero de documentos). Hefesto, se enfoca en el anlisis de los


requerimientos de la empresa, la identificacin de las carencias de informacin que se
tienen, los indicadores y "perspectivas" del negocio, y acto seguido se procede al
anlisis de las fuentes de datos, como se puede apreciar a continuacin:

Figura 1 Etapas Metodologa de Hefesto

(HEFESTO)

Figura 2 Metodologa Hefesto

(HEFESTO)

Hay muchas ms tecnologas para la implementacin de inteligencia de negocios pero las


que se ajustan a nuestro negocio es la metodologa kimball.

2.2.1 Metodologa de Kimball parar construccin de


Datamarts

Figura 3 Metodologa de Kimball parar


construccin de Datamarts

(Elaborado por: MILAN)

2.2.2Etapas de la Metodologa de Kimball.

Planificacin, Planificacin del Proyecto.

Requerimientos, Definicin de requerimientos.

Anlisis, Arquitectura tcnica.

Diseo, Seleccin de herramientas, Diseo fsico.

Construccin, Diseo de la puesta en escena (Staging) y desarrollo.

Despliegue, Implantacin y Mantenimiento.

2.2.3 Justificacin de Herramientas de Desarrollo


Las herramientas que se han escogido para el desarrollo del presente proyecto son:

Gestor de Base de datos: SQL SERVER 2012.


Herramienta de Aplicacin: VISUAL STUDIO 2013 (para compilar el SQL server

2012 BI).
Herramienta para Inteligencia de Negocio: TABLEAU 9.0 Desktop
Herramienta para Inteligencia de negocio: SQL SERVER DATA TOOLS (SSDTBI).

Herramienta para Inteligencia de Negocio: MICROSOFT SQL SERVER 2012


(ANALYSIS SERVICES,INTEGRATION SERVICES,REPORTING SERVICES)

Diseo del cubo:Workbench.

A continuacin se presenta la justificacin del uso de estas herramientas en base a


parmetros generales que se tomaran en cuenta en el anlisis pertinente a cada uno
de estos.

Costo de licencia.
La mejor adaptacin al proyecto

Costo de Implementacin.

Crecimiento de las organizaciones.

Facilidad de acceso.

Justificacin de tableau 9.0 Desktop para la inteligencia de negocio.

Es un software de Business Intelligence


Es un producto de anlisis de datos
Es una herramienta de anlisis que ayuda a mejorar y acelerar la toma de
decisiones de la empresa
Por su funcionalidad. Es muy til para el negocio, para una mejor toma de
decisiones.
Gran capacidad visual de anlisis. Facilita la comprensin de datos.
Es intuitivo. Se aprende muy rpidamente a utilizarlo, es de muy fcil uso.
Precio Su precio est por debajo de la media del mercado.

2.2.5 Justificacin de SQL SERVER DATA TOOLS (SSDT-BI)


2014
SQL Server Data Tools - Business Intelligence (SSDT-BI) para Visual Studio incluye
herramientas de creacin de proyectos de inteligencia empresarial y plantillas de
proyectos para SQL Server Analysis Services, Reporting Services e Integration
Services integrados en el shell de Visual Studio. Puede instalar SSDT-BI como un
entorno de creacin de inteligencia empresarial independiente o paralelo con un SQL
Server Data Tools (SSDT) existente. Es importante entender que SSDT-BI y SSDT son
dos paquetes de descarga e instalacin separados. Estas instrucciones son para

descargar e instalar SSDT-BI. Para ms informacin

2.2.6 Justificacin de SQL SERVER 2012 como gestor de


base de datos.
1) Un primer factor muy importante para escoger a SQL SERVER 2012 como gestor
de base de datos es el tipo de proyecto que estamos implementando, por el interfaz
amigable que muestra por la licencia y es ms accesible.
Si el tipo de proyecto fuera bajo un ambiente propietario donde adems se puedan
pagar altos costos de licencias, seguramente se podra optar por una solucin
privativa como Oracle, la misma que por la mayora de expertos es considerada
como el mejor gestor de base de datos.
Se adjunta informacin de comparativas de base de datos realizadas por Forrester.

Figura 4 Estudio Forrester 2009 sobre Gestores de Base de Datos

(Estudio Forrester)

2. Para elegir un gestor de bases de datos se debe tomar en cuenta aspectos como:
prestigio (Probado y utilizado en entornos de produccin), fiabilidad, velocidad,
rendimiento, facilidad de administracin y conexin con otros productos,
documentados, con perspectiva de evolucin, soporte y capacitacin.

Se va a construir un datamart, por lo que la prioridad ser la velocidad de acceso a


los datos (habr cargas de datos regulares cuando estemos alimentando el DW a
partir de los sistemas operacionales, y la mayora de accesos sern para consultar
dichos datos).

Para mejorar el rendimiento de la base de datos, en la tabla de hechos (que tendr


una gran cantidad de registros, pues en ella se guardarn todas las transacciones
de eventos, herramientas, organizaciones y proyectos) Si el volumen de esta tabla
es demasiado grande se requerir realizar particionamiento.

2.2.7Justificacin de sql server 2012 Como Suite de BI


Compila e implemente soluciones BI corporativas seguras, escalables y administrables
con anlisis e informes avanzados. Los usuarios profesionales se benefician de los
anlisis predictivos, con la sencillez y familiaridad de Microsoft Excel, gracias a los
complementos de minera de datos de SQL Server para Microsoft Office.

Anlisis de alto rendimiento

Nuestro motor de anlisis in-memory proporciona un salto


generacional en el rendimiento, permitiendo al mismo tiempo la
interaccin con una cantidad de datos sin precedentes. La
funcionalidad en memoria se integra justo en los motores de
anlisis de SQL Server, para una mayor facilidad de uso y
flexibilidad.
Datos veraces y coherentes

TI puede controlar y administrar mejor los datos a travs de un


modelo semntico de BI, que proporciona una vista coherente de
orgenes de datos heterogneos, adems de mejoras en SQL
Server Integration Services.
Calidad de datos slida

Mejore la calidad de los datos haciendo uso de los conocimientos


de la organizacin y recurriendo a proveedores de datos de
terceros de referencia para generar perfiles, limpiar y buscar
coincidencias en los datos.
Administracin de datos maestros

Mantenga los datos maestros en todas las estructuras de la


organizacin para la asignacin de objetos, datos de referencia y
administracin de metadatos.
Disponibilidad, seguridad y administracin de datos bsicas

La edicin Business Inteligencie tambin incluye la funcionalidad


de base de datos bsica de SQL Server Standard para
aplicaciones departamentales, como la compatibilidad bsica
con Windows Server y los roles definidos por el usuario para
configurar la separacin de tareas.

Figura 5 (la implementacin de inteligencia de negocios para toma de


decisiones)

3.1 La solucin BI en SQL server 2012 /data tools 2014

Fig
ura 6 SSDT-BI PARA EL PROCESO DE NEGOCIO

El servidor OLAP
Para obtener la funcionalidad de procesamiento analtico en lnea (OLAP) se utilizan
otras dos aplicaciones: el servidor OLAP Mondrian, que combinado con Jpivot,
permiten realizar querys a Datamarts, que los resultados sean presentados mediante
un browser

Data Mining
Pentaho est incorporando la tecnologa Weka que es una herramienta extensible e

integrable que incluye herramientas para realizar transformaciones sobre los datos,
tareas de clasificacin, regresin, clustering, asociacin y visualizacin.
ETL
Extract, Transform and Load (extraer, transformar y cargar, frecuentemente
abreviado ETL) es el proceso que permite a las organizaciones mover datos desde
mltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos, data
mart, o data warehouse para analizar, o en otro sistema operacional para apoyar un
proceso de negocio.

Fi
gura 7 (PROCESO DE INTEGRACION)

3.2

La solucin BI en tableau

3.2.1Caractersticas:
Muy rpido. Es suficiente con arrastrar y soltar para cambiar los

parmetros de su anlisis
Fcil de utilizar. Tableau es una herramienta intuitiva que e permite ver
todos los cambios a medida que los va realizando.
Cuadros de mando brillantes. Es capaz de combinar varios anlisis en un
nico informe donde se inserten pginas webs y documentos para una
mejor explicacin y comprensin de las cifras.
Conexin directa. Tableau elimina el paso previo para crear universos,
cubos y tablas temporales. Su conexin es directa, no se requiere
programacin.
Mashups perfectos. Un anlisis a partir de la combinacin de datos de
distinto origen simplemente supone conectar cada fuente en otro plano
para arrastrarlos y soltarlos en un clic.

Capitulo2 DEFINICIN DE REQUERIMIENTOS Y


ANLISIS DE NEGOCIO
El objetivo de este captulo es describir a la empresa industrias y derivados del sur
S.A.C las ares de ventas y productos en AYACUCHO -HUAMANGA que ser nuestro
caso de estudio, as como el anlisis del datamart para la inteligencia de negocio para
la empresa en el rubro de bebidas gasificadas, las consideraciones y requerimientos
tomados en cuenta para su solucin, su arquitectura y el modelo de datos definido.

2.1 Captura y Especificacin de Requisitos


Inteligencia de negocio de la empresa INDUSTRIAS Y DERIVADOS DEL SUR S.A.C
Para la mejor toma de decisiones de sus diferentes reas .

2.1.1 Caso de Estudio

2.1.2 Objetivos del Sistema

Se requiere implementar un datamart, para almacenar los datos necesarios que


mediante la aplicacin de tcnicas ETL y tcnicas OLAP, que otorguen la informacin
adicional y relevante a la que brinda el sistema de administracin.
Tambin se precisa de la posibilidad de visualizacin de informacin en diferentes
perspectivas (dimensiones) para tener mayores argumentos que permitan una
justificacin de las decisiones que se tomen referentes al Software Libre y su difusin.

A futuro seria importarte desarrollar un mdulo en el sistema de administracin que


permita ligar o relacionar a los usuarios con el proceso de aprendizaje o capacitacin
en el software Libre, para que de esta forma se pueda determinar patrones de
aprendizaje, porcentajes de desercin, factores que favorezcan al crecimiento del

software libre, factores individuales y sociales que afectan al crecimiento del Software
Libre.

2.1.4 Recursos tecnolgicos con los que cuenta


Actualmente la EMPRESA INDUSTRIAS DERIVADOS DEL SUR no cuenta con un
base de datos, servidor donde se pueda almacenar toda su informacin requerida
para la inteligencia de negocio.
Se tiene que considerar adicional a esto que la empresa solo cuenta con libros de
Excel donde almacenan su informacin de ventas, pedidos, de sus productos.

2.1.5 Recursos tecnolgicos que necesita


Se requiere construir una base de datos relacional para optimizar sus procesos, se
requiere aplicaciones para simplificar sus procesos de elaboracin de sus productos,

2.2 Anlisis Dimensional


2.2.1 Mdulos del Sistema

2.2.1.1 Modelo Lgico


Para poder realizar el anlisis es necesario entender la estructura del negocio como
se establece en la metodologa de Kimball para datawarehousin, a continuacin se
muestra el modelo de datos que va manejar la empresa.
Modelo de datos para la inteligencia de negocio de la empresa (INDUSTRIAS Y
DERIVADOS DEL SUR)

Preguntas de investigacin
En qu grado las tecnologas de informacin y las
herramientas de BI ayudan a los ejecutivos en la toma de
decisiones estratgicas?
Cmo asegurar una buena integracin de los datos en los
sistemas de informacin de las organizaciones?
17
Daena: International Journal of Good Conscience. 4(2) : 16-52. Septiembre 2009.
ISSN 1870-557X.
Cmo asegurar la calidad de la informacin en los
sistemas organizacionales, para una buena toma de
decisiones?
Existe alguna diferencia entre informacin y
conocimiento?
Se pueden lograr ventajas competitivas tomando buenas
decisiones apoyados con herramientas de BI?

ANALSIS

2.3 Arquitectura del Sistema


2.3.1 Arquitectura Tcnica
La arquitectura de la solucin est conformada por tres grandes capas, que son:
integracin, anlisis y visualizacin.
La capa de integracin, se extraen los datos de las bases de datos operacionales y
se seleccionan los campos necesarios conforme al modelo de datos. Posteriormente
los datos pasan por un proceso ETL donde se limpian y estandarizan, ya que de esta
forma se eliminan inconsistencias y posibles errores que pudiera llegar a existir.
Posterior a ello estos datos sern almacenados en estructuras (tablas), relacionales y
de esta forma quedara implantado en datamart.
La capa de anlisis, esta capa comprende la aplicacin de tcnicas OLAP y
algoritmos de data mining de ser el caso, tcnicas relacionadas a data mining, pero
por cuestiones de escalabilidad queda abierta la posibilidad de usar data mining
dentro de la arquitectura del sistema.
Para OLAP, desde la capa de visualizacin, que se explicara posteriormente, por el
usuario que ejecuta una consulta, la cual es formulada en lenguaje MDX.
Posteriormente por el motor OLAP que se encarga de mapear las consultas en
lenguaje MDX a sentencias SQL, sern ejecutadas en la base de datos relacional
donde reside el datamart. La informacin resultante es regresada al motor OLAP y
este se encarga de enviarla nuevamente a la capa de visualizacin.
La capa de visualizacin, es la capa que permite mostrar al usuario final los
resultados, que se obtienen de la aplicacin de las tcnicas OLAP, de una forma que
el usuario los pueda interpretar ms fcilmente.
Los resultados pueden visualizarse a travs de textos, tablas y grficos. Esta variedad
facilita la comprensin e interpretacin de los mismos. De esta manera el usuario

puede interactuar y manipular la informacin de su inters para analizarla desde


diferentes perspectivas. Dichas perspectivas le permitirn obtener informacin
relevante que le ayudar a crear estrategias justificadas que traigan beneficiosa a la
empresa.

You might also like