You are on page 1of 10

BIG DATA

SBADO 25 DE OCTUBRE DEL 2014


Tras pulsar una contrasea, pasar una tarjeta, tocar un lector de huellas dactilares
y mirar por un escner de retina se accede a una sala aislada en la que grandes
ordenadores, de algo ms de dos metros de altura, se alinean en los pasillos, entre
el permanente zumbido del aire acondicionado. Jeff Brown, consejero delegado
de Cobalt Data Centers, la empresa que alberga la sala, seala hacia varios tubos
que salen de las mquinas y se meten en el falso techo. "Chimeneas. Permiten
disipar el calor y gastar menos en refrigeracin. Para nosotros es una novedad",
afirma. Tras recorrer la instalacin con la mirada, comenta orgulloso: "Aqu est
la nube".
La nube, ese (an impreciso) concepto de un megaordenador formado por
millones de dispositivos interconectados y accesibles por cualquiera en todo el
mundo, no est en este centro de datos, situado en un anodino polgono
industrial a las afueras de Las Vegas (EE UU). No toda, al menos. Pero el
mecanismo que piensa revolucionar la economa digital lo que en el siglo XXI
quiere decir prcticamente toda la economa est situado en edificios como este,
interconectados por vastas (y costosas) redes de fibra ptica de alta capacidad.
Segn un estudio de la consultora IDC, en 2013 haba instalados en todo el
mundo alrededor de 35 millones de servidores, cuyo coste de mantenimiento se
acerca a los 250.000 millones de dlares (200.000 millones de euros).
Otro estudio de la misma empresa calcula que en 2013 se invirtieron 47.000
millones de dlares en crear estructuras incluido software de nube pblica,
inversiones que llegarn a 107.000 millones en 2017. "Este sector est al rojo
vivo", apunta Brown. "Hacemos lo que podemos para seguir el ritmo de
crecimiento. Terminamos nuestro centro de datos en enero de 2013 y ya estamos
en plenas obras de ampliacin".

El planeta cada vez produce ms informacin, a travs de ms dispositivos, en


ms sitios y con ms aplicaciones. Cada minuto se generan datos suficientes como
para llenar el equivalente a 360.000 discos DVD, segn la Unin Europea. Pero
con un desafo adicional: la mayora de esos nuevos datos se estn generando en
aparatos interconectados, por lo que la informacin que va a circular por las redes
globales va a crecer a un ritmo an ms acelerado. IDC ha afirmado que si hoy
menos de un 20% del contenido digital est relacionado en todo o en parte con la
nube, en seis aos esa cifra llegar a casi el 40%.
La recogida, almacenaje y anlisis de ese ocano de datos es solo una parte del
llamado big data, la base de la prometida revolucin econmica. "El verdadero
objetivo es saber cmo puedo convertir esos datos desestructurados en
informacin susceptible de aplicarle cerebro", apunta Alfonso del Gallo, director
general de la consultora Experian Marketing Services en Espaa. "Porque
entonces podremos convertirla en conocimiento con el que poder tomar
decisiones. Pero no todos los datos me van a servir; algunos son relevantes para
saber algunas cosas y otros no".

Las previsiones y las expectativas respecto a lo que se puede hacer con esa
informacin son apabullantes. Segn un estudio de la consultora MGI, citado por
la OCDE, si los 23 mayores Gobiernos de Europa implementasen por completo
sistemas de big data, podran reducir sus costes entre un 15% y un 20%, acelerar
la productividad medio punto durante los prximos 10 aos y generar entre
150.000 y 300.000 millones de euros (el equivalente a alrededor del 1% del PIB
de la UE).

Pero el xito de esa revolucin depende del buen funcionamiento de la


infraestructura. "El problema con el que se encuentran las empresas es cmo
gestionar volmenes ingentes de datos que cambian a la velocidad de la luz,
porque, adems, la gente est interactuando constantemente con ellos", seala
Del Gallo. "Antes tenas un nombre, un DNI, una direccin y un telfono. Y ya.
Hoy tienes eso, las cuentas en redes sociales, una o varias tarjetas de crdito,
direcciones de correo electrnico, varios mviles, y el da de maana el reloj, las
gafas, la nevera...".
Si un producto o servicio quiere sacarle partido a ese universo interconectado, es
necesario garantizar que est disponible en todo momento desde cualquier
dispositivo. La informtica Veeam organiz un congreso sobre el tema en Las

Vegas en el que estuvieron presentes varios medios internacionales entre ellos


EL PAS por invitacin de la empresa.
"Los negocios deben estar siempre conectados", afirm Ratmir Timashev,
consejero delegado de Veeam, en la inauguracin del evento. "Las empresas ya no
se pueden permitir funcionar solo en horario de oficina, o tener sus servidores
desconectados durante horas por un error".
Un estudio de 2011 del Instituto Ponemon calcul que cada minuto en el que un
servidor est fuera de servicio le cuesta a una empresa una media de 5.617 dlares
(4.400 euros). Pero casi tan importante como los costes econmicos, est el dao
al prestigio. El 10 de octubre de 2011, los servidores de la empresa canadiense
Research in Motion, propietaria de Blackberry, empezaron a fallar. Durante los
siguientes cuatro das, la cada de los servicios de la compaa fue noticia en todo
el mundo. Adems de costarle 54 millones de dlares, la debacle aceler la crisis
en la que estaba inmersa, en la que perdi su posicin de predominio en el
mercado de los smartphones y de la que todava no se ha recuperado del todo.
Pese al persistente crecimiento del mercado de los centros de datos, la propia IDC
reconoce que el incremento del nmero de servidores fsicos ha perdido fuelle. El
motivo es, precisamente, la expansin de la nube: la nueva tecnologa hace
posible transferir los datos de la empresa a un servidor externo, lo que evita los
problemas y gastos de tener instalaciones propias de almacenaje.
Una de las empresas que ha marcado como objetivo estratgico tener presencia
en ese potencial mercado es Google. "Todo el mundo habla de nubes", seala
Isaac Hernndez, director para Espaa y Portugal de Google for Work, la divisin
orientada a empresas de la multinacional estadounidense. "Pero para ganar en un
mercado tan complejo se requiere tener un tamao y una estructura. Y nosotros
lo tenemos". Para Hernndez, el aumento de la competicin sacar del sector a las
compaas que no tengan la capacidad de adaptarse lo suficientemente rpido.
"Sin duda, habr una consolidacin del mercado".
"Es una tendencia, sin duda", afirma Ian Brown, profesor de Seguridad
Informtica y Privacidad del Instituto de Internet de la Universidad de Oxford.
"Por ejemplo, Amazon tiene una enorme capacidad de proceso de datos que solo
usa en los que la demanda est en mximos, como la temporada de Navidad.
Durante el resto del ao se puede vender esa capacidad sobrante".
Eso s: ese fenmeno no ser universal. "Existirn diferentes modelos de
aprovechamiento de la nube", apunta Brown. "Las start ups y las empresas

pequeas, sobre todo, sern las que utilizarn la nubepblica. Los negocios ms
maduros, como las grandes empresas, tendrn que mantener sus propios
servidores". "A la mayora de las empresas le puede valer la nube", confirma Del
Gallo, "pero imagnate un hospital. Podra externalizar sus datos? Tcnicamente
s, pero las clusulas legales y de salvaguarda haran que no valiese la pena".
Pese a los avances en las tecnologas de seguridad, los consumidores tienen
motivos para estar recelosos de lo que sucede con sus datos ah fuera. Por un
lado, la posibilidad de ataques de vndalos informticoscomo los que a principios
de septiembre mostraron los fallos en la seguridad de los servidores externos de
Apple. Paradjicamente, Brown considera que la consolidacin del sector tendr
efectos positivos en la seguridad informtica. "Las grandes empresas tienen una
ventaja y es que pueden contratar a los mejores", indica el profesor de la
Universidad de Oxford. "Yo creo que se hace un trabajo mucho mejor para
proteger los datos en empresas como Google, Microsoft o Amazon".
Por otro lado, los consumidores temen que el propio Gobierno pueda meter la
cabeza en sus datos privados. El jueves, la empresa china de mviles Xiaomi
anunci que empezara a trasladar los datos de sus clientes internacionales a
servidores en Singapur, Hong Kong y Estados Unidos. Aunque la empresa
justific la decisin, entre otros motivos, en la necesidad de reducir los tiempos
de interconexin, la posibilidad de que los datos de los usuarios acabasen en
manos del Gobierno chino haba hecho saltar las alarmas en la prensa de pases
como India o Taiwn. No es el nico caso. En 2013, tras las acusaciones de
espionaje contra la Agencia de Seguridad Nacional estadounidense (NSA, en sus
siglas en ingls), Brasil pidi a Google transferir los datos de sus usuarios del pas
sudamericano a servidores en territorio nacional.
Otro recelo es que el avance de la tecnologa lleve a la existencia deparasos de
datos, grandes servidores instalados en pases con legislaciones ms laxas donde
la informacin est fuera del alcance de las autoridades judiciales o tributarias.
"Ahora mismo no se puede hacer porque no hay pas con suficiente ancho de
banda, pero no creo que lo lleguemos a ver, incluso a largo plazo", afirma Brown.
"Dudo que ni los legisladores ni los tribunales permitan que una empresa pueda
legalmente alojar datos sensibles en esa clase de instalaciones".
La Unin Europea, ansiosa por consolidar la posicin del continente en el
mercado tecnolgico y temerosa de la posibilidad de que la nube se lleve empleos
a pases emergentes, ha mostrado inters por el sector de la informacin. Aunque
la industria de los centros de procesos de datos empleaba en 2010 a 385.900

personas en la UE (un 4,8% de ellas en Espaa), segn Eurostat, es precisamente


la clase de puestos de trabajo que Bruselas cree que el continente no puede
permitirse perder.
El 13 de octubre, la vicepresidenta de la Comisin Europea, Nellie Kroes, anunci
una inversin de 2.500 millones de euros de los cuales 500 salidos de los
presupuestos de la UE hasta 2020 con el objetivo de lograr que el bloque tenga
un 30% de cuota de mercado en el sector de los datos, lo que, segn Bruselas,
permitir crear 100.000 empleos. La nueva comisin encabezada por el
luxemburgus Jean-Claude Juncker tiene la intencin declarada de mantener
esas polticas. "En el ltimo Consejo Europeo, Juncker dijo que el futuro de la UE
se basa en la economa de datos", apunta Klaus-Dieter Platte, consultor de la
iniciativa Big Data Value, en la que participan empresas como Orange, SAP o
Siemens. Uno de los seis vicepresidentes del nuevo Ejecutivo comunitario, el ex
primer ministro estonio Andrus Ansip, tiene la cartera de Mercado Comn
Digital.

Atados a la fibra ptica


Los cables de fibra ptica que interconectan los continentes y permiten el funcionamiento de Internet
son la otra pata de la economa global de datos. El sector ha crecido de forma explosiva: de 2009 a 2014
los datos transmitidos por estas redes se multiplicaron por cuatro, segn la consultora Telegeography.
Aunque hay empresas como la propia Google (el segundo operador mundial) o la india Tata capaces
de hacer frente a la construccin de estas infraestructuras por s solos, la mayora de los cables son
propiedad de consorcios formados por grandes empresas de telecomunicaciones. Son tambin
estructuras frgiles y poco protegidas. En enero de 2008, la ruptura de varios cables de Internet en el
mar Mediterrneo ralentiz o interrumpi el funcionamiento de la Red para ms de 1.600 millones de
personas de Egipto a India.

TENER MS DATOS NO QUIERE DECIR QUE HAYA MEJOR INFORMACIN


Las clases de sobre Cmo ser un mejor usuario de datos que imparte Roberto
Rigobon en el Massachusetts Institute of Technology estn abarrotadas.
"Normalmente un curso de nuestra escuela tiene 40 o 50 alumnos", comenta. "En
una de mis clases hay 90 y en otra 70. Hay gente sentada en las escaleras". Este
venezolano habla con sonriente y desatado entusiasmo horas antes de dar una
conferencia en la Fundacin Rafael del Pino. El tema: de cmo los datos, por s
mismos, no son lo importante: para sacarles partido y tomar decisiones hay que
incorporar el factor humano.

Pregunta. Est la infraestructura global preparada para una economa basada


en el uso masivo de datos?
Respuesta. Yo creo que, desde un punto de vista tcnico y fsico, hay
infraestructura para manejar toda esta cantidad de datos, al menos por un par de
dcadas.
P. Cul es el principal reto?
R. Lo que hay que entender es que existe una gran distancia entre los datos y la
informacin. Producimos una inmensa cantidad de datos, pero eso no significa
que estemos haciendo ms o mejor informacin. Por ejemplo: gracias al
procesador de texto, hoy en da escribir es ms fcil que nunca, si lo comparamos
con el esfuerzo que tena que hacer Cervantes para escribir. Pero no estamos
haciendo ms literatura de calidad que en tiempos de Cervantes. Yo creo que
podemos aprender mucho de los datos, pero se ha sobrevendido su potencial de
tener un contenido informativo.
P. Por ejemplo?
R. Hay muchas cosas que la tecnologa no te puede hacer. Las estadsticas te
dicen que la mayora de los que mueren ahogados en el ocano son muy buenos
nadadores. Con esos datos en la mano, si te preguntas si debes ensear a tus hijos
a nadar, la respuesta es no. Y no hay tecnologa que puedas usar ni datos que
puedas recolectar que expliquen la decisin de quien fuera que saliese a nadar y
se pusiera a s mismo en peligro. Puede que haya sobreestimado su habilidad,
pero eso no lo puedo saber! Qu solucin te propone el big data? Agarrar a
todos los nios de Madrid, tirarles a cinco kilmetros de la costa y llegar a la
conclusin, correcta, de que el que nada peor se ahoga antes y que no saber nadar
no te salva de morir ahogado, as que hay que ensear a los nios a nadar. Pero
no creo que debiramos llegar a ese punto para tener esa respuesta [re]. Hay ms
fondos de capital riesgo que han quebrado tras usar big data que fondos que han
triunfado. Y estamos hablando del sector financiero: gente muy inteligente.
P. Cul es el problema?
R. Me parece un error gravsimo la gente que dice que los datos hablan por s
solos: los datos nunca hablan por s solos. Los datos son como los criminales:
puedes hacerlos confesar, pero no siempre te van a dar la informacin que t
quieres.

P. Qu hay que hacer?


R. Lo que tratamos es buscar la informacin ms relevante; por ejemplo, lo que
hacemos con los precios. Junto a Alberto Cavallo, otro profesor en el MIT,
llevamos 12 aos coordinando un proyecto de mejorar la recoleccin de datos
estadsticos a travs de las nuevas tecnologas. Pongamos el caso de Amazon, que
vende cerca de 53 millones de productos. Imagnate que quiero medir cunto han
cambiado los precios en Amazon. Yo tengo la capacidad de bajar toda esa
informacin; no me supone ningn problema. Pero algo ms de 22 millones de
esos productos son libros o msica. Y solo 500 de esos libros representan ms del
90% de las ventas. Yo solo necesito esos 500 libros para obtener un dato
relevante. Para qu bajarse el resto? Es totalmente intil. Es un ejemplo de que
no se trata de fuerza bruta.
P. Si no se trata de fuerza bruta, de qu se trata? Es ms el software o las
personas?
R. No hay una carrera universitaria de anlisis de datos. Y quien se dedique a esto
va a necesitar un poco de conocimiento de ingeniera tcnica, un poco de
economa, un poco de sociologa, un poco de psicologa... y eso todava no existe.
P. Cul es la consecuencia?
R. Que estamos hablando de la revolucin de datos, pero en muchos casos falta
conocimiento a la hora de saber qu es informacin. Una empresa te puede
recoger un montn de datos y vendrtelos. T, como no tienes ni idea, te crees
que con esos datos puedes aprender de todo. Pero cuando no hay gente que sepa
cmo preguntar a esos datos, se hacen preguntas al azar. Y cuando haces
preguntas al azar, obtienes respuestas al azar. Si lo nico que te han vendido es
un par de correlaciones mal hechas, tomas decisiones equivocadas basadas en
esos datos. Y fracasas. Hay gente invirtiendo muchsimo dinero en recolectar
datos, pero no saben que cuando ms datos tienes ms difcil es procesarlos, y se
quedan sentados sin saber qu hacer con ellos. Eso son recursos que se pierden.
P. Hay excepciones?
R. S, claro. Google y Microsoft, por ejemplo, se han beneficiado de esa economa
de datos, lo que molesta a mucha gente. Pero el problema es que ahora esas
empresas son como cinco.
P. En qu va a cambiar la forma de entender los negocios?

R. Las organizaciones estn cambiando. En poco tiempo, las empresas tendrn


que tener un director de datos igual que tienen un director financiero. En Google,
la oficina del economista jefe, la persona encargada de ver qu hacer con todos
esos datos, tiene su despacho al lado de la oficina del consejero delegado. Y es una
tendencia que va a ir a ms.
P. Est cuantificado ese dficit de gente preparada para procesar y entender
datos?
R. Dos profesores del MIT, Andy McAfee y Erik Brynjolfsson, tienen un libro
titulado La segunda edad de las mquinas. Andy cuantifica que solo en Estados
Unidos se crearn 10 millones de empleos en cinco aos. Yo lo veo algo
exagerado. Pero si invertimos las cifras, cinco millones de empleos en 10 aos,
eso s lo veo posible.

TECNOLOGA DESDE LA NUBE


Hay varias formas para aumentar la productividad, pero en perodos de crisis se
suele recurrir a las ms drsticas y contraproducentes, que consisten en despedir
y bajar salarios. El discurso ms avanzado recuerda que la productividad (y, por
lo tanto, los beneficios) se acrecienta eficazmente mediante la inversin en capital
humano (formacin y, si se puede, continua), en tecnologa de uso en la empresa
y en infraestructuras. Pero este discurso, tantas veces pronunciado en trminos
genricos, o no se concreta o se aplica sin conviccin. Este es una de las cargas
que impide el despegue econmico en periodos de transicin (como el actual) y
obstaculiza que aumente el techo de empleo potencial en etapas de relativa
prosperidad. El elevado paro estructural en Espaa tiene varias causas, pero esta
es una de ellas. El retraso en la aplicacin de nuevas tecnologas no suele
recuperarse despus de forma satisfactoria. Esta es una primera observacin
sobre esa oportunidad tecnolgica en ciernes que ya aparece en el horizonte: la
nueva

estructura

digital

formada

por

redes

masivas

de

fibra

ptica

interconectadas, accesibles desde todo el mundo, que se conoce como la nube.


Existe ya un cierto consenso en que los paquetes masivos de informacin digital
constituyen el siguiente paso o salto de progreso que mejorar la productividad
de la economa. Los estudios, cuyo porcentaje de voluntarismo debe ser corregido
habitualmente con dosis de prudente realismo, se felicitan de las expectativas de
aumentar la productividad y de reducir los costes (incluso los energticos) que
ofrece la nube. Si entre 2005 y 2020 el contenido de datos digitalizados se va a
multiplicar por 300, es evidente que aparecen nuevas oportunidades de negocio

(como, por ejemplo, gestionar esa informacin) y que una correcta gestin de los
macrodatos implicar ayudas significativas en tareas fundamentales para la
comunidad, desde la direccin de hospitales, hasta el control del trfico o la
seguridad ciudadana. Para las empresas es una oportunidad de reducir costes en
mbitos distintos del laboral y para los ciudadanos abre la posibilidad de
ahorrarse trmites enojosos, privados o pblicos, o acceder a servicios que en
teora pueden ser ms baratos.
Ahora bien, no deben confundirse las expectativas con las tendencias, ni con los
proyectos, ni con la eleccin consciente de los responsables pblicos o las
empresas. La nube es un concepto que todava est algunos pisos por encima de
la realidad. Para bajarla a tierra se necesitan iniciativas de inversin, voluntad
poltica de incentivar el paso tecnolgico y decisin para regular el nuevo salto
tecnolgico, de forma que no se lamenten a posteriori los efectos secundarios de
la innovacin. Existen ejemplos suficientes hoy (vulneraciones de intimidad, uso
desleal o inapropiado de la informacin digital) como para extraer las lecciones
pertinentes sobre las tecnologas de inmediata aplicacin.
La tecnologa acelera el crecimiento econmico y el empleo, pero no es un
producto espontneo o mostrenco, que surge sin trabajo o inversin. Por el
contrario, los saltos tecnolgicos son el producto final de un largo esfuerzo y de
complejas decisiones. Y, si no se quiere que provoquen ms inconvenientes que
ventajas, no deben aplicarse de forma improvisada.

ENCONTRAR DATOS REELAVANTES EN LA LECTURA Y CITARLOS.

You might also like