You are on page 1of 2

BIG DATA principales de una oportunidad para Big categorías puedan extenderse con el

Data. avance tecnológico.


El primer cuestionamiento que
posiblemente llegue a su mente en este 2. ¿De dónde proviene
momento es ¿Qué es Big Data y porqué toda esa información?
se ha vuelto tan importante? pues bien,
Los seres humanos estamos creando y
en términos generales podríamos
almacenando información
referirnos como a la tendencia en el
constantemente y cada vez más en
avance de la tecnología que ha abierto
cantidades astronómicas. Se podría
las puertas hacia un nuevo enfoque de
decir que si todos los bits y bytes de
entendimiento y toma de decisiones, la
datos del último año fueran guardados
cual es utilizada para describir enormes
en CD's, se generaría una gran torre
cantidades de datos (estructurados, no
desde la Tierra hasta la Luna y de
estructurados y semi estructurados)
regreso.
que tomaría demasiado tiempo y sería
Esta contribución a la acumulación
muy costoso cargarlos a un base de
masiva de datos la podemos encontrar
datos relacional para su análisis. 1.- Web and Social Media: Incluye
en diversas industrias, las compañías
mantienen grandes cantidades de contenido web e información que es
Además del gran volumen de obtenida de las redes sociales como
datos transaccionales, reuniendo
información, esta existe en una Facebook, Twitter, LinkedIn, etc, blogs.
información acerca de sus clientes,
gran variedad de datos que pueden ser 2.- Machine-to-Machine (M2M): M2M
proveedores, operaciones, etc., de la
representados de diversas maneras en se refiere a las tecnologías que
misma manera sucede con el sector
todo el mundo, por ejemplo de permiten conectarse a otros
público.
dispositivos móviles, audio, video, dispositivos. M2M utiliza dispositivos
sistemas GPS, incontables sensores 3. ¿Qué tipos de datos como sensores o medidores que
digitales en equipos industriales, debo explorar? capturan algún evento en particular
automóviles, medidores eléctricos, (velocidad, temperatura, presión,
Muchas organizaciones se enfrentan a
veletas, anemómetros, etc., los cuales variables meteorológicas, variables
la pregunta sobre ¿qué información es
pueden medir y comunicar el químicas como la salinidad, etc.) los
la que se debe analizar?, sin embargo,
posicionamiento, movimiento, cuales transmiten a través de redes
el cuestionamiento debería estar
vibración, temperatura, humedad y alámbricas, inalámbricas o híbridas a
enfocado hacia ¿qué problema es el
hasta los cambios químicos que sufre el otras aplicaciones que traducen estos
que se está tratando de resolver.
aire, de tal forma que las aplicaciones eventos en información significativa.
Si bien sabemos que existe una amplia
que analizan estos datos requieren que
variedad de tipos de datos a analizar,
la velocidad de respuesta sea lo 3.- Big Transaction Data:
una buena clasificación nos ayudaría a
demasiado rápida para lograr obtener la Incluye registros de facturación, en
entender mejor su representación,
información correcta en el momento telecomunicaciones registros
aunque es muy probable que estas
preciso. Estas son las características detallados de las llamadas (CDR), etc.
Estos datos transaccionales están Solución Big Data de administración (con una consola
disponibles en formatos tanto única con System Center).
semiestructurados como no Microsoft 3. Facilidad para descubrir y aplicar
estructurados. información del negocio,
La visión de Microsoft es mediante el uso de herramientas
4.- Biometrics: Información biométrica proporcionar conocimiento de
en la que se incluye huellas digitales, conocidas como PowerPivot para
negocios a partir de cualquier tipo de Excel, SQL Server Analysis y
escaneo de la retina, reconocimiento datos,
facial, genética, etc. En el área de Reporting Services de SQL
incluyendo conocimiento previamente server, se puede tener una
seguridad e inteligencia, los datos escondido en datos no estructurados.
biométricos han sido información integración y explotación de
Para lograr este objetivo, datos en poco tiempo y con
importante para las agencias de Microsoft ofrecerá distribuciones de grandes resultados.
investigación. Windows Server y Windows Azure
5.- Human Generated: Las personas basadas en Apache GRAFOS EN DATOS MASIVOS
generamos diversas cantidades de Hadoop, acelerando su adopción en las
datos como la información que guarda empresas. Los grafos tienen una serie de
un call center al establecer una llamada Esta nueva distribución características muy sencillas de
telefónica, notas de voz, correos basada en Hadoop por Microsoft comprender:
electrónicos, documentos electrónicos, permite a los clientes obtener una
estudios médicos, etc. visión de negocios sobre datos • Están formados por nodos y
estructurados y no estructurados de relaciones
cualquier tamaño y activar nuevos tipos • Los nodos contienen
de datos. Esta información extraida de propiedades (del tipo clave-
Hadoop se puede combinar valor)
perfectamente con la plataforma • Las relaciones tienen un
de Business Intelligence de Microsoft. nombre y siempre parte de
Beneficios clave: un nodo de inicio a otro de
destino.
1. Ampliar y facilitar el acceso a • Las relaciones también
Hadoop por medio de una pueden tener propiedades.
instalación y configuración
sencilla, además de
programación simplificada con
JavaScript.
2. Una distribución Hadoop “lista
para la empresa”, con mayor
seguridad (integrada al Directorio
Activo de Microsoft) y facilidad de

You might also like