You are on page 1of 10

Historia de Data Warehouse

INGENIERÍA EN SOFTWARE

Toluca México a 19 de febrero del 2019

¿Cómo surgió el data warehouse?

R1.1: Los orígenes de las bases de datos se remontan a la Antigüedad donde ya


existían bibliotecas, censos, archivos médicos y toda clase de registros. Se
desarrollaron principios básicos utilizados hoy como los índices, además también se
utilizaban para recoger información sobre las cosechas y censos. Sin embargo, su
búsqueda era lenta y poco eficaz y no se contaba con la ayuda de máquinas que
pudiesen reemplazar el trabajo manual. Posteriormente, el uso de las bases de datos
se desarrolló a partir de las necesidades de almacenar grandes cantidades de
información o datos. Sobre todo, desde la aparición de las primeras computadoras, el
concepto de bases de datos ha estado siempre ligado a la informática. En 1884
Herman Hollerith creó la máquina automática de tarjetas perforadas, siendo
nombrado así el primer ingeniero estadístico de la historia. En esta época, los censos
se realizaban de forma manual [Salvador, 2013].

R1.2: En las décadas de 1970 y 1980, los datos comenzaron a proliferar y las
organizaciones necesitaban una forma fácil de almacenar y acceder a esa
información. El científico de computo Bill Inmon, quien es considerado el padre de los
data warehouses, comenzó a definir el concepto en la década de 1970 y se le acredita
haber adoptado el término “data warehouse”. Él publicó Building the Data Warehouse
(Construcción del almacén de datos), libro aclamado como fuente fundamental de la
tecnología de los almacenes de datos, en 1992. La definición del almacén de datos
de Inmon utiliza un enfoque “descendente", donde primero se establece un repositorio
centralizado, y luego se crean depósitos de datos – que contienen subconjuntos de
datos específicos – dentro de ese repositorio [SAS, 2019].

R1.3: En general el concepto se originó un poco antes de a mediados de los años


80s, en esencia, dicha tecnología pretende proporcionar un modelo de arquitectura
para el flujo de datos de los sistemas operacionales y los ambientes de decisión. Es
decir, intenta direccionar los diferentes problemas relacionados a este flujo de datos,
y los altos costos asociados. La ausencia de tal arquitectura ocasiona un alto índice
de redundancia en la administración y distribución de la información, por ejemplo, en
empresas grandes las decisiones de los diferentes proyectos que operan
independientemente dependen de múltiples bases de datos, en donde en la mayoría
de los casos existe información en común que puede ser compartida con el Data
Warehouse sin necesidad de que dichos datos se repitan [Tripod, 2019].

Ensayo 1
El data warehause se remonta a la antigüedad donde ya estaban las bibliotecas
censos, archivos médicos y toda clase de registros. Se desarrollaron principios
básicos utilizados hoy como los índices Posteriormente, el uso de las bases de datos
se desarrolló a partir de las necesidades de almacenar grandes cantidades de
información o datos. Sobre todo, desde la aparición de las primeras computadoras, el
concepto de bases de datos ha estado siempre ligado a la informática. En 1884
Herman Hollerith creó la máquina automática de tarjetas perforadas, siendo
nombrado así el primer ingeniero estadístico de la historia. En esta época, los censos
se realizaban de forma manual [Salvador, 2013].

Había que crear un nicho que no existía antes. Así que lo primero que hubo que
realizar fue una definición formal de qué era y para qué servía esa cosa nueva; las
empresas tenían una necesidad de acceder a su información de negocio sin
cortapisas, pero no estaba claro cómo se podría aprovechar la gran potencia teórica
de estos sistemas para obtener resultados tangibles. En una palabra, había que
estructurar el mensaje comercial para convencer a las empresas de que les sería muy
útil gastarse una fortuna en un nuevo gran sistema, probablemente incompatible con
todos los que tenía ya instalados. Era un trabajo para los especialistas de marketing
de los grandes fabricantes. El resultado fue el concepto de Data Warehouse, allá por
los años 93-94 del siglo pasado [Macluskey, 2009]. Los orígenes de data warehousing
y los Decisión Support Systems (DSS) se remonta muy atrás a los comienzos de la
computadora y los sistemas de información y continúa evolucionando día a día.

¿Cómo se llevo a cabo la evolución de la data


warehause?
R2.1: En los últimos años, la evolución en el almacenamiento de datos ha llegado a
una nueva cumbre, con el despliegue de la capacidad de soporte de decisiones en
toda la organización e, incluso, más allá de sus límites convencionales, a socios y
clientes. La nueva generación de implementaciones de data warehouse mejora la
ejecución de una estrategia de negocios, además de su desarrollo.

Presentación de informes

La etapa inicial de implementación del data warehouse, por lo general, se centra en


la presentación de informes provenientes de una sola fuente de autenticidad dentro
de la organización. El data warehouse aporta un enorme valor mediante la integración
de diversas fuentes de información dentro de una empresa en un único repositorio
para impulsar la toma de decisiones, a través de fronteras funcionales y de producto.

Análisis
En esta etapa de implementación, la toma de decisiones se centra menos en lo que
ha sucedido y más en por qué esto sucedió. Las actividades de análisis tienen que
ver con la profundización de los números en un informe, para examinar
minuciosamente los datos a un nivel detallado. El análisis Ad hoc juega un papel
importante en la etapa, en la puesta en marcha del data warehouse. La gestión del
rendimiento se basa mucho más en la capacidad avanzada de optimización en el
RDBMS (Sistema de Gestión de Bases de Datos Relacionales) porque las estructuras
de consulta no son tan predecibles como lo son en un entorno de información pura.

Predicción

Cuando una organización se fortalece en términos cuantitativos de toma de


decisiones técnicas y experiencias, por el valor proporcionado en la comprensión del
“qué” y “por qué” en la dinámica de negocio, el siguiente paso será aprovechar la
información con fines predictivos. Esta etapa requiere de herramientas de minería de
datos para la construcción de modelos predictivos con detalles históricos.

Puesta en funcionamiento

La evolución de la puesta en marcha en esta etapa comienza a ponernos en el ámbito


activo del almacenamiento de datos. Mientras que las fases anteriores se centran en
las decisiones estratégicas de una organización, la puesta en funcionamiento se
centra en el apoyo a las decisiones tácticas. Piense en el apoyo a la decisión
estratégica en la manera de proporcionar la información necesaria para tomar
decisiones de negocio a largo plazo. La puesta en marcha normalmente significa el
acceso a la información para la inmediata toma de decisiones en terreno.

Almacenamiento activo

El amplio papel que juega un activo data warehouse en los aspectos operativos de
apoyo a las decisiones, el incentivo más que el negocio, ha de automatizar los
procesos de decisión. Como la tecnología evoluciona, cada vez más decisiones son
ejecutadas a raíz de un suceso que desencadena el inicio de procesos de decisión
totalmente automatizados. Un activo data warehouse proporciona información y
permite el apoyo a decisiones en toda la organización, en lugar de limitarse a los
procesos de toma de decisiones estratégicas. Sin embargo, el apoyo a las decisiones
tácticas no reemplaza el apoyo a las decisiones estratégicas [CIO, 2018].
R2.2: El concepto del data warehouse ha evolucionado de sobre manera en estos
últimos años de forma que el concepto original nos sirve de partida pero para nada
representa toda la variedad y riqueza de opciones presentes. Actualmente existen
diferentes enfoques / tecnologías que aúnan una visión de tecnología optimizada, de
necesidades de negocio y de incluso software específico para desplegar soluciones
de Inteligencia de negocio.

Listemos alguna de ellas:

-Inclusión de mapreduce en el software del data warehouse, que permite procesar


grandes cantidades de datos distribuidas en clústers. Por ejemplo, en este punto
tenemos a fabricantes como Greenplum o Aster Data Systems. Y empresas como
Google o Facebook como usuarios destacados.

-Soluciones in-memory, que despliegan estructuradas de datos multidimensionales


en memoria con el objetivo de minimizar el tamaño de estructuras MOLAP así como
agilizar la velocidad de consulta. Entre estos ejemplos tenemos Qlikview y
Panopticon.

-Estructuras multidimensionales.

-Estructuras federadas de data marts.

-Integración a tiempo real.

-Data marts específicos.

-Active Data Warehouse.

-Soluciones que conjunta software y hardware optimizado (con algunas de las


características comentadas). Por ejemplo, estamos hablando de fabricantes como
Teradata o Kickfire.

-Bases de datos híbridas (columnas y filas) que permiten beneficiarse de las


características singulares tanto de desarrollos por filas o por columnas [Curto, 2010].

Ensayo 2
El concepto del data warehouse ha evolucionado de sobre manera en estos últimos
años de forma que el concepto original nos sirve de partida pero para nada representa
toda la variedad y riqueza de opciones presentes. Actualmente existen diferentes
enfoques / tecnologías que aúnan una visión de tecnología optimizada, de
necesidades de negocio y de incluso software específico para desplegar soluciones
de Inteligencia de negocio [Curto, 2010].

En los últimos años, la evolución en el almacenamiento de datos ha llegado a una


nueva cumbre, con el despliegue de la capacidad de soporte de decisiones en toda
la organización e, incluso, más allá de sus límites convencionales, a socios y clientes.
La nueva generación de implementaciones de data warehouse mejora la ejecución
de una estrategia de negocios, además de su desarrollo.

Se mejoro su desarrollo y una mejor ejecución en las estrategias de negocios.

Presentación de informes

La etapa inicial de implementación del data warehouse, por lo general, se centra en


la presentación de informes provenientes de una sola fuente de autenticidad dentro
de la organización. El data warehouse aporta un enorme valor mediante la integración
de diversas fuentes de información dentro de una empresa en un único repositorio
para impulsar la toma de decisiones, a través de fronteras funcionales y de producto.

Análisis

En esta etapa de implementación, la toma de decisiones se centra menos en lo que


ha sucedido y más en por qué esto sucedió. Las actividades de análisis tienen que
ver con la profundización de los números en un informe, para examinar
minuciosamente los datos a un nivel detallado. El análisis juega un papel importante
en la etapa, en la puesta en marcha del data warehouse. La gestión del rendimiento
se basa mucho más en la capacidad avanzada de optimización en el RDBMS
(Sistema de Gestión de Bases de Datos Relacionales) porque las estructuras de
consulta no son tan predecibles como lo son en un entorno de información pura.

Predicción

Cuando una organización se fortalece en términos cuantitativos de toma de


decisiones técnicas y experiencias, por el valor proporcionado en la comprensión del
“qué” y “por qué” en la dinámica de negocio, el siguiente paso será aprovechar la
información con fines predictivos. Esta etapa requiere de herramientas de minería de
datos para la construcción de modelos predictivos con detalles históricos.

Puesta en funcionamiento

La evolución de la puesta en marcha en esta etapa comienza a ponernos en el ámbito


activo del almacenamiento de datos. Mientras que las fases anteriores se centran en
las decisiones estratégicas de una organización, la puesta en funcionamiento se
centra en el apoyo a las decisiones tácticas. Piense en el apoyo a la decisión
estratégica en la manera de proporcionar la información necesaria para tomar
decisiones de negocio a largo plazo. La puesta en marcha normalmente significa el
acceso a la información para la inmediata toma de decisiones en terreno.

Almacenamiento activo

El amplio papel que juega un activo data warehouse en los aspectos operativos de
apoyo a las decisiones, el incentivo más que el negocio, ha de automatizar los
procesos de decisión. Como la tecnología evoluciona, cada vez más decisiones son
ejecutadas a raíz de un suceso que desencadena el inicio de procesos de decisión
totalmente automatizados. Un activo data warehouse proporciona información y
permite el apoyo a decisiones en toda la organización, en lugar de limitarse a los
procesos de toma de decisiones estratégicas. Sin embargo, el apoyo a las decisiones
tácticas no reemplaza el apoyo a las decisiones estratégicas [CIO, 2018].

Ensayo final
El data warehause se remonta a la antigüedad donde ya estaban las bibliotecas
censos, archivos médicos y toda clase de registros. Se desarrollaron principios
básicos utilizados hoy como los índices Posteriormente, el uso de las bases de datos
se desarrolló a partir de las necesidades de almacenar grandes cantidades de
información o datos. Sobre todo, desde la aparición de las primeras computadoras, el
concepto de bases de datos ha estado siempre ligado a la informática. En 1884
Herman Hollerith creó la máquina automática de tarjetas perforadas, siendo
nombrado así el primer ingeniero estadístico de la historia. En esta época, los censos
se realizaban de forma manual [Salvador, 2013].

En los últimos años, la evolución en el almacenamiento de datos ha llegado a una


nueva cumbre, con el despliegue de la capacidad de soporte de decisiones en toda
la organización e, incluso, más allá de sus límites convencionales, a socios y clientes.
La nueva generación de implementaciones de data warehouse mejora la ejecución
de una estrategia de negocios, además de su desarrollo.

Se mejoro su desarrollo y una mejor ejecución en las estrategias de negocios.

Presentación de informes

La etapa inicial de implementación del data warehouse, por lo general, se centra en


la presentación de informes provenientes de una sola fuente de autenticidad dentro
de la organización. El data warehouse aporta un enorme valor mediante la integración
de diversas fuentes de información dentro de una empresa en un único repositorio
para impulsar la toma de decisiones, a través de fronteras funcionales y de producto.

Análisis

En esta etapa de implementación, la toma de decisiones se centra menos en lo que


ha sucedido y más en por qué esto sucedió. Las actividades de análisis tienen que
ver con la profundización de los números en un informe, para examinar
minuciosamente los datos a un nivel detallado. El análisis juega un papel importante
en la etapa, en la puesta en marcha del data warehouse. La gestión del rendimiento
se basa mucho más en la capacidad avanzada de optimización en el RDBMS
(Sistema de Gestión de Bases de Datos Relacionales) porque las estructuras de
consulta no son tan predecibles como lo son en un entorno de información pura.

Predicción

Cuando una organización se fortalece en términos cuantitativos de toma de


decisiones técnicas y experiencias, por el valor proporcionado en la comprensión del
“qué” y “por qué” en la dinámica de negocio, el siguiente paso será aprovechar la
información con fines predictivos. Esta etapa requiere de herramientas de minería de
datos para la construcción de modelos predictivos con detalles históricos.

Puesta en funcionamiento

La evolución de la puesta en marcha en esta etapa comienza a ponernos en el ámbito


activo del almacenamiento de datos. Mientras que las fases anteriores se centran en
las decisiones estratégicas de una organización, la puesta en funcionamiento se
centra en el apoyo a las decisiones tácticas. Piense en el apoyo a la decisión
estratégica en la manera de proporcionar la información necesaria para tomar
decisiones de negocio a largo plazo. La puesta en marcha normalmente significa el
acceso a la información para la inmediata toma de decisiones en terreno.

Almacenamiento activo

El amplio papel que juega un activo data warehouse en los aspectos operativos de
apoyo a las decisiones, el incentivo más que el negocio, ha de automatizar los
procesos de decisión. Como la tecnología evoluciona, cada vez más decisiones son
ejecutadas a raíz de un suceso que desencadena el inicio de procesos de decisión
totalmente automatizados. Un activo data warehouse proporciona información y
permite el apoyo a decisiones en toda la organización, en lugar de limitarse a los
procesos de toma de decisiones estratégicas. Sin embargo, el apoyo a las decisiones
tácticas no reemplaza el apoyo a las decisiones estratégicas [CIO, 2018].

Referencias
[CIO, 2018] cio.com.mx (2018). Cinco etapas de la evolución del data
warehouse. Recuperado de http://cio.com.mx/cinco-etapas-de-la-evolucion-del-data-
warehouse/
[Carlosproal, 2019] Carlosproal.com (2019). 1.2 Data warehouse y Business
Intelligence. Recuperado de http://carlosproal.com/dw/dw01.html
[Powerdata, 2013] Powerdata.com (2013). La evolución de Data Warehouse
con el Big Data: Analytic Data Warehouse. Recuperado de
https://blog.powerdata.es/el-valor-de-la-gestion-de-datos/bid/328882/la-evoluci-n-de-
data-warehouse-con-el-big-data-analytic-data-warehouse
[Curto, 2010] Curto, J. (2010). Sobre la evolución del data warehouse.
Recuperado de http://josepcurto.com/2010/01/06/sobre-la-evolucion-del-data-
warehouse/
[Salvador, 2013] Salvador, r. (2013). Historia de las bases de datos.
Recuperado de http://olapdw.blogspot.com/2013/02/historia-de-las-bases-de-
datos.html
[SAS, 2019] sas.com (2019). Data Warehouse. Recuperado de
https://www.sas.com/es_mx/insights/data-management/data-
warehouse.html#dmhistory
[Macluskey, 2009] Macluskey (2009). Historia de un Viejo Informático. El
Data Warehouse entró en nuestras vidas… para quedarse. Recuperado de
https://eltamiz.com/elcedazo/2009/06/08/el-data-warehouse-entro-en-nuestras-
vidas-para-quedarse/
[Tripod, 2019] Tripod.com (2019). Historia de Data Warehouse. Recuperado de
http://trabajofinal4.tripod.com/historia.html

You might also like