Professional Documents
Culture Documents
Tabla de contenidos
1.
Introduccin
2.
3.
4.
5.
6.
7.
8.
La estrategia de calidad
9.
10.
11.
Conclusin
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin
1. Introduccin
La falta de calidad de los datos es uno de los principales problemas a los que se enfrentan los
responsables de sistemas de informacin y las empresas en general, pues representa claramente
uno de los problemas "ocultos" ms graves y persistentes en cualquier organizacin.
En efecto, una buena calidad de datos es el
activo
corporativo
ms
potente, ya que
expectativa
establecida,
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin
2. La importancia de la calidad
de datos
Debido a los crecientes avances de la tecnologa en cuanto a gestin de datos e informacin, las
empresas se ven enfrentadas da a da a un aumento en la cantidad y diversidad de los datos que
deben gestionar y en los elementos a las cuales se les asocian estos datos e informacin.
Este aumento exponencial ha derivado en
un manejo cada vez ms ineficiente de los
datos a nivel de empresas, lo cual afecta
directamente en su desempeo y en la
toma de decisiones, dificultando este hecho
la gestin organizacional.
Dado lo anterior y entendiendo que la
gestin de datos constituye un recurso
estratgico en la organizacin, se hace
imprescindible que se garantice la calidad
de los datos en cualquier empresa de hoy
en da.
Datos externos
Frecuentemente se incorporan datos externos de forma automtica en los sistemas de informacin
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin
de las organizaciones, sin tomar las precauciones oportunas, y esto provoca que se generen
multitud de problemas de Calidad de Datos.
Migraciones
Cuando se realiza una migracin de datos sin haber
previamente analizado en profundidad los cambios que
hay que aplicar a la informacin, una de las muchas
consecuencias suele ser la ausencia de calidad de
datos, existencia de valores obsoletos o en un formato
distinto al esperado en el nuevo sistema, e incluso
duplicidades.
Muchas veces los primeros problemas comienzan en la
carga inicial y rara vez los datos se cargan sin errores
durante la extraccin, transformacin y carga de los
datos.
Los errores generalmente se dividen en tres categoras.
Errores por informacin incompleta: consisten en registros o campos faltantes. Qu es lo que no
se carg y qu pasar con esos registros o campos sin datos?
Sintaxis: est relacionada con el formato de los datos y cmo se representan. Tienen los datos la
forma correcta? Se encuentran los datos dentro del intervalo de valores?
Semntica: transmite el significado de los datos. Hay valores ocultos en los datos no
estructurados? Hay nombres en los campos de direcciones, a pesar del cumplimiento de la forma
correcta de los datos? Existen registros duplicados con leves diferencias?
*Crditos foto:
www.bizjournals.com/kansascity/blog/2012/07/group-worries-google-service-may-widen.html?page=2
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin
http://www.iabuk.net/events/library/digital-project-management
3. Qu se entiende
Calidad de Datos?
por
efecto,
los
datos
deben
dar y
ste, al ser
utilizado,
debe
satisfacer
las
anterior
se
hace efectivo
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin
Supervisar y limpiar de forma proactiva los datos de todas las aplicaciones, y mantener
limpios estos datos.
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin
4. Dimensiones de calidad de
datos
Para abordar de manera ntegra la problemtica en la calidad de datos, debe realizarse un anlisis
por cada una de las dimensiones de calidad de datos, logrando de esta manera resolver cada una
de las dudas existentes en el proceso y mitigando as los riesgos de fracaso en los proyectos de
este tipo.
En este sentido, lo importante y prioritario es tener un punto de partida, una mtrica que permita
identificar el estado actual de los datos.
Para ello, es bsico realizar una auditora inicial o perfilamiento
de los datos, con el objetivo de averiguar en qu estado se
encuentran stos y a partir de ah, detectar qu se debe corregir y
a su vez determinar parmetros de control que ayuden a medir el
avance en los procesos de calidad.
Estos parmetros son conocidos como las seis dimensiones de
calidad de datos y son consideradas como los puntos clave que
debe de cubrir la calidad de los datos para asegurar nuestros
procesos de limpieza y calidad.
Conformidad
8
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin
Los datos que estn en los campos de la tabla, deben estar en un formato estndar y legible.
Consistencia
Al hacer el cruce de informacin con los registros, se debe evitar la informacin contradictoria.
Precisin / Exactitud
Si los datos no son precisos, estos no
pueden ser utilizados. En este sentido, para
detectar si estos son precisos, se compara
el dato con una fuente de referencia.
Duplicacin
Es importante saber si se tiene la misma
informacin en formatos iguales o similares
dentro de la tabla.
Integridad
Otra dimensin de calidad importante radica en el hecho de saber si toda la informacin relevante
de un registro est presente de forma que se pueda utilizar.
El entendimiento de estas seis dimensiones es el primer paso para la mejora de la calidad de datos.
Ser capaz de identificar y separar los defectos de los datos clasificndolos por estas dimensiones,
nos permite aplicar las tcnicas adecuadas para mejorar tanto la informacin como los procesos
que crean y manipulan la informacin.
* Crditos foto:
http://www.unicreditbulbank.bg/Blog/CATEGORIES/Our_experts/BLOG_POST?doc=CUSTOMER_CARE
http://kommunikationsledelse.dk/2010/11/10/2010-i-kommunikationsmalingernes-tegn/
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin
5. Consecuencias de
errores en los datos.
los
Los errores en los datos afectan de diversas formas a las organizaciones. Una de las principales
implicaciones se genera en los procesos de toma de decisiones los cuales se vuelven inefectivos e
ineficientes.
Una pobre calidad de datos implica
riesgos significativos en la toma de
decisiones y en la operacin y gestin
de las empresas. Como consecuencia
de ello, quienes toman las decisiones en
una compaa acostumbran a dejar de
lado algunas cosas que deberan saber
e incluso aparentan estar informados
pero con informacin errnea.
La mala calidad de los datos es uno de los principales indicadores de proyectos fallidos y, a
menudo,es identificada como la causa raz de los fallos de procesos, siendo tambin la principal
causante de las decisiones errneas en una organizacin.
Las estrategias de reduccin de costos y de maximizacin de
ingresos,
especialmente
aqullas
que
dependen
de
10
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin
genera en el cliente el tiempo que se dedica a la solucin del problema creado por el error.
Existe tambin, un costo en tiempo y recursos para la empresa al dedicarse a la deteccin y
correccin de los errores, lo que provoca grandes problemas en la productividad y retrasos en la
gestin de otras tareas importantes, entre otras desagradables consecuencias.
Tambin es considerable el efecto de los errores de los datos respecto del xito de nuevas
aplicaciones informticas ya que stos deben proporcionar una visin nica y precisa, adems de
estar correctamente relacionados e interrelacionados con todas las fuentes a utilizar.
* Crditos foto:
http://www.expand2web.com/blog/survey-reports-small-businesses-with-poor-websites-may-lose-customers/
http://under30ceo.com/startup-after-answering-these-three-questions-on-risk/
11
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin
a) Verificacin Manual
Esta alternativa permite, tericamente, localizar la mayora de los errores ms comunes, y ello se
logra verificando en base a la fuente original de la informacin todos y cada uno de los valores,
permitiendo de este modo determinar qu valores son correctos y cules no. No obstante, esta
alternativa posee algunas desventajas, sobre todo respecto al costo asociado a las HH.
b) Anlisis Automtico
Utilizan tanto el software como la habilidad del analista de calidad de datos para detectar los
errores. stas se pueden aplicar a:
Transacciones que estn ocurriendo.
Bases de Datos que estn cambiando.
Bases de Datos en produccin, peridicamente.
Existen cuatro categoras de anlisis que se
pueden aplicar a los datos:
Anlisis de elementos (datos)
Anlisis estructural.
Anlisis de Reglas de Negocio.
Anlisis Estadsticos.
12
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin
Las tcnicas analticas bien aplicadas, identifican suficientes errores para dar una idea clara del
estado de calidad de datos. Sin embargo un programa continuo de mejoramiento de la calidad de
los datos, logra resultados satisfactorios.
* Crditos foto:
http://nguyentantrieu.info/blog/automatic-testing-web-application-website-webservice/
13
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin
2. Perfilado
Es una auditora de Calidad de Datos con la entrega de un cuadro de mando que identifica, clasifica y
cuantifica los problemas de calidad dentro de todas las fuentes. El objetivo de la auditora es
generar una medida tangible de la calidad de los datos al inicio, que le permitir aclarar las
condiciones actuales, como por ejemplo, fuentes de datos con 25% duplicados, los datos de 20%
atributos redundantes, etc.
3. Limpieza
Mediante este proceso clave se definen las reglas y se establecen metas a alcanzar. Por ejemplo,
antes de la entrada en funcionamiento, la calidad de datos debe ser del 85% para los atributos de
prioridad.
14
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin
4. Coincidencias
Consiste
en
estandarizacin,
el
diseo
coincidencia
de
la
y
limpieza,
reglas
de
consolidacin.
5. Consolidacin
En esta etapa se implementan los procesos de
mejora en la calidad de los datos (definidos en el
punto nmero 3).
6. Monitorizacin
Una vez que el proceso de calidad de los datos se ha implementado, es importante que se informe
sobre los resultados, es decir, la presentacin de informes para la distribucin de los resultados,
incluyendo desglose y alertas.
15
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin
8. La estrategia de calidad
En muchas etapas del proceso de gestin de datos se puede aplicar la calidad, ya que sta se
relaciona directamente con la integracin, por lo que deben considerarse como parte de una
misma estrategia que conjugue:
Servicios.
Metodologa.
Herramientas.
Las empresas, en la prctica, tienen un gran problema de calidad que se extiende desde el interior
de la organizacin hacia fuera, proyectndose en aspectos como las relaciones con los clientes,
la toma de decisiones y la productividad. En un entorno as, es difcil fiarse del dato y ste es
precisamente
el
objetivo de la funcin de
Calidad.
Cada vez hay ms datos
de ms fuentes en ms
sistemas: ERPs, fuentes
externas,
web,
call
Datawarehouses,
etc:
centres,
todos los procesos se
informatizan,
volmenes
los
aumentan,
16
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin
la mala calidad de datos conlleva problemas de pagos en sistemas ERP, SCM, etc.
En efecto, todos los procesos se automatizan y cada vez hay menos intervencin humana. En
efecto, una persona detectara y cancelara por sentido comn un proceso errneo, como por
ejemplo, el envo de una carta a la calle equivocada, mientras que un sistema automatizado de
mailing, no.
Por ltimo, hay que tener en cuenta que los clientes esperan un mejor servicio. Los datos
defectuosos llevan a una pobre gestin del cliente que cada vez es ms exigente y cada vez conoce
mejor sus derechos.
* Crditos foto: http://www.hawkassociates.co.uk/innovation/
17
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin
9. En qu consiste Data
Quality?
Informatica Data Quality transforma la forma de trabajar de su empresa. Este software permite
que todo el mundo confe en todos sus datos para todas sus necesidades y en todo momento.
Informatica Data Quality ofrece calidad de datos generalizada a todos los usuarios, proyectos,
dominios de datos y aplicaciones empresariales, en entornos locales o en el cloud, y adems con
una sola plataforma unificada.
Entre las funciones principales de Data Quality se incluyen:
Compatibilidad integral con todos los datos y todos los fines, para que pueda aplicar reglas
de calidad de datos a datos de clientes, de productos, financieros y de activos, as como
reutilizar esas reglas en todo tipo de proyectos de integracin y calidad de datos.
Apertura a todas las aplicaciones, para que pueda acceder a cualquier fuente de datos, en
cualquier lugar (en entornos locales, con socios o en el cloud), y desplegar reglas
18
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin
centralizadas de calidad de datos para mejorar la calidad de los datos en todas las
aplicaciones
Con Informatica Data Quality, toda su empresa puede:
19
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin
Data
considerablemente
Quality
los
reduce
costes
identificar
todos
los
datos
en
todas
dominios
de
las
datos,
pases e idiomas.
Con esta solucin pueden eliminar herramientas de calidad de datos redundantes y recortar
drsticamente los costes de licencia y mantenimiento mediante la estandarizacin de procesos, y
todo ello bajo una sola plataforma que ofrece un nico conjunto de reglas y herramientas
reutilizables para gestionar la calidad de datos en numerosos proyectos.
b) Reduccin de riesgos
Informatica
identificar,
Data
resolver
Quality
y
ayuda
evitar
los
penalizaciones
reglamentarias.
Puede establecer procesos de calidad
20
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin
de datos sostenibles a largo plazo y confiar en todos los datos de la empresa. Al aplicar la calidad
de datos sistemticamente en todas las aplicaciones de forma global, aumenta la confianza en que
todos sus datos cumplan con los procesos de gobierno de datos. Asimismo, gracias la fiabilidad
demostrada de Informatica Data Quality en las implantaciones para toda la empresa, se reduce el
riesgo de perodos de inactividad.
c) Actuacin ms eficaz
Con Informatica Data Quality, el departamento de IT y el resto de la empresa pueden trabajar
juntos de forma ms eficaz para realizar proyectos en das, en lugar de realizarlos en meses.
En efecto, los gestores de lnea de negocio, analistas empresariales y administradores de datos
disponen de sus propias herramientas para gestionar las tareas de calidad de datos por s mismos.
Los departamentos de IT obtienen un nico entorno unificado de alta productividad para el
perfilado y la limpieza de datos, y para la gestin de reglas de calidad de datos que se pueden
reutilizar en todos los proyectos de integracin y calidad de datos.
d) Mejora de la productividad de IT
El entorno comn de proyectos y las herramientas de colaboracin de Informatica Data Quality
aceleran el ciclo de especificacin
empresa. Los departamentos de IT pueden acceder a todos los datos con rapidez para llevar a
cabo los proyectos de calidad de datos en plazos ms cortos.
Adems, pueden crear reglas reutilizables de calidad de datos con facilidad, gestionarlas de
forma centralizada
21
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin
11. Conclusin
Para poder obtener un buen control de calidad se requiere cubrir todo un procedimiento para
poder lograr nuestro objetivo, que es mejorar la calidad para una mejor y mayor satisfaccin del
cliente y de uno mismo como empresa o industria.
Por medio de las etapas tenemos la oportunidad de detectar cualquier anomala que se pudiera
presentar durante cualquiera de nuestros procesos antes de alcanzar nuestro fin, por ello es
importante llevar a cabo un seguimiento adecuado, correcto y de mejora continua.
Las empresas que le dan importancia a la calidad de sus datos, les permiten obtener beneficios
claves para agregar valor al negocio y diferenciarse del resto de sus competidores, otorgando:
Toma
de
oportunas,
decisiones
en
base
de
a
negocio
informacin
Mejorar la confianza, buenas relaciones e imagen de la empresa antes sus clientes frente a
la competencia.
22
Lacalidaddedatos
Losfactoresimprescindiblesatenerencuentaenuna
corporacin