BIG DATA principales de una oportunidad para Big categorías puedan extenderse con el
Data. avance tecnológico.
El primer cuestionamiento que posiblemente llegue a su mente en este 2. ¿De dónde proviene momento es ¿Qué es Big Data y porqué toda esa información? se ha vuelto tan importante? pues bien, Los seres humanos estamos creando y en términos generales podríamos almacenando información referirnos como a la tendencia en el constantemente y cada vez más en avance de la tecnología que ha abierto cantidades astronómicas. Se podría las puertas hacia un nuevo enfoque de decir que si todos los bits y bytes de entendimiento y toma de decisiones, la datos del último año fueran guardados cual es utilizada para describir enormes en CD's, se generaría una gran torre cantidades de datos (estructurados, no desde la Tierra hasta la Luna y de estructurados y semi estructurados) regreso. que tomaría demasiado tiempo y sería Esta contribución a la acumulación muy costoso cargarlos a un base de masiva de datos la podemos encontrar datos relacional para su análisis. 1.- Web and Social Media: Incluye en diversas industrias, las compañías mantienen grandes cantidades de contenido web e información que es Además del gran volumen de obtenida de las redes sociales como datos transaccionales, reuniendo información, esta existe en una Facebook, Twitter, LinkedIn, etc, blogs. información acerca de sus clientes, gran variedad de datos que pueden ser 2.- Machine-to-Machine (M2M): M2M proveedores, operaciones, etc., de la representados de diversas maneras en se refiere a las tecnologías que misma manera sucede con el sector todo el mundo, por ejemplo de permiten conectarse a otros público. dispositivos móviles, audio, video, dispositivos. M2M utiliza dispositivos sistemas GPS, incontables sensores 3. ¿Qué tipos de datos como sensores o medidores que digitales en equipos industriales, debo explorar? capturan algún evento en particular automóviles, medidores eléctricos, (velocidad, temperatura, presión, Muchas organizaciones se enfrentan a veletas, anemómetros, etc., los cuales variables meteorológicas, variables la pregunta sobre ¿qué información es pueden medir y comunicar el químicas como la salinidad, etc.) los la que se debe analizar?, sin embargo, posicionamiento, movimiento, cuales transmiten a través de redes el cuestionamiento debería estar vibración, temperatura, humedad y alámbricas, inalámbricas o híbridas a enfocado hacia ¿qué problema es el hasta los cambios químicos que sufre el otras aplicaciones que traducen estos que se está tratando de resolver. aire, de tal forma que las aplicaciones eventos en información significativa. Si bien sabemos que existe una amplia que analizan estos datos requieren que variedad de tipos de datos a analizar, la velocidad de respuesta sea lo 3.- Big Transaction Data: una buena clasificación nos ayudaría a demasiado rápida para lograr obtener la Incluye registros de facturación, en entender mejor su representación, información correcta en el momento telecomunicaciones registros aunque es muy probable que estas preciso. Estas son las características detallados de las llamadas (CDR), etc. Estos datos transaccionales están Solución Big Data de administración (con una consola disponibles en formatos tanto única con System Center). semiestructurados como no Microsoft 3. Facilidad para descubrir y aplicar estructurados. información del negocio, La visión de Microsoft es mediante el uso de herramientas 4.- Biometrics: Información biométrica proporcionar conocimiento de en la que se incluye huellas digitales, conocidas como PowerPivot para negocios a partir de cualquier tipo de Excel, SQL Server Analysis y escaneo de la retina, reconocimiento datos, facial, genética, etc. En el área de Reporting Services de SQL incluyendo conocimiento previamente server, se puede tener una seguridad e inteligencia, los datos escondido en datos no estructurados. biométricos han sido información integración y explotación de Para lograr este objetivo, datos en poco tiempo y con importante para las agencias de Microsoft ofrecerá distribuciones de grandes resultados. investigación. Windows Server y Windows Azure 5.- Human Generated: Las personas basadas en Apache GRAFOS EN DATOS MASIVOS generamos diversas cantidades de Hadoop, acelerando su adopción en las datos como la información que guarda empresas. Los grafos tienen una serie de un call center al establecer una llamada Esta nueva distribución características muy sencillas de telefónica, notas de voz, correos basada en Hadoop por Microsoft comprender: electrónicos, documentos electrónicos, permite a los clientes obtener una estudios médicos, etc. visión de negocios sobre datos • Están formados por nodos y estructurados y no estructurados de relaciones cualquier tamaño y activar nuevos tipos • Los nodos contienen de datos. Esta información extraida de propiedades (del tipo clave- Hadoop se puede combinar valor) perfectamente con la plataforma • Las relaciones tienen un de Business Intelligence de Microsoft. nombre y siempre parte de Beneficios clave: un nodo de inicio a otro de destino. 1. Ampliar y facilitar el acceso a • Las relaciones también Hadoop por medio de una pueden tener propiedades. instalación y configuración sencilla, además de programación simplificada con JavaScript. 2. Una distribución Hadoop “lista para la empresa”, con mayor seguridad (integrada al Directorio Activo de Microsoft) y facilidad de