Professional Documents
Culture Documents
Resumen:
1. Introduccin ........................................................................................ 2
5. Conclusiones .......................................................................................24
6. Bibliografa .........................................................................................25
1
1. Introduccin
Adems, la ley del Plan gallego de estadstica 2012-2016 establece como objetivos
instrumentales: sensibilizar a la sociedad mediante servicios y actividades que
potencien el conocimiento a travs de la estadstica y contribuir al desarrollo de la
sociedad de la informacin, proporcionando la oferta estadstica como un servicio
electrnico.
2
Por todo lo anterior, la estructura y accesibilidad a las bases de datos se convierte
en una cuestin clave en las tareas de difusin, pues condiciona el acceso a los
datos y las posibilidades en cuanto a interoperabilidad y uso de los mismos. En el
IGE disponemos de tres bases de datos en las que se almacena la informacin que
se publica en la web: una en la que se almacenan las tablas multidimensionales,
otra en la que se almacenan los indicadores y otra para las series de coyuntura. El
servicio de Informtica del IGE disea y programa las distintas aplicaciones
mediante las que se accede a las bases de datos, permitiendo realizar tareas de
grabacin, intercambio entre las distintas bases de datos o publicacin en la web.
Esta estructura de bases de datos permite, adems del acceso mediante tablas
multidimensionales, que es la forma ms comn de difusin de datos estadsticos
en la web del IGE, la captura directa de informacin de la base de datos, lo que
evita la manipulacin de la informacin y facilita la actualizacin de la misma.
3
2. Difusin de indicadores
4
fuentes (Eurostat y Banco de datos del IGE). La base de datos est en MySQL y la
visualizacin de los indicadores se realiza en una interfaz web diseada con Jquery.
Los datos generales del indicador incluyen: el cdigo, que es nico para cada
indicador; el tipo, que permite indicar si el indicador es calculado o no (los
indicadores calculados son aquellos que se construyen mediante operaciones
aritmticas simples a partir de otros indicadores ya existentes en la base de datos);
la periodicidad del indicador; el nmero de decimales con el que se quiere
difundir en la web; los mbitos espaciales para los que se va a definir el
indicador; la visibilidad o no en el apartado web de las APIs de descarga de
indicadores; las frmulas, en el caso de que el indicador sea calculado.
5
que se recuperarn para la visualizacin en la web, la primera en la pgina inicial y
la segunda en el resto de apartados.
6
Tabla IGE
Indicador IGE
Relacin
7
Imagen 3. Statistics Database. Eurostat
El conjunto de datos de esta tabla est integrado por 6 variables: TIME, GEO, SEX,
WSTATUS, UNIT y AGE.
8
Para importar los datos de Eurostat se necesita, como se mencion antes, crear
una relacin entre el fichero de Eurostat y el indicador, para lo que se precisa el
enlace de descarga del fichero de Eurostat. Al introducir el enlace en un formulario
del programa tsvimport.exe, este permite crear las relaciones y para ello se
muestran las variables del fichero Eurostat; el paso siguiente es especificar los
parmetros de la relacin, que son los siguientes: perodo inferior desde el que se
quieren importar los datos; mbitos geogrficos a importar (en nuestro caso ES,
EU27, EU28 o todos); filtros de las variables de la tabla de Eurostat (excepto TIME
y GEO) que determinan el dato; el cdigo del indicador al que se van a importar
los datos. Enlace de descarga del
fichero de Eurostat
Variables
Indicador IGE
Eurostat
9
La jerarqua de visualizacin en la aplicacin cliente no viene determinada por la
jerarqua almacenada en la base de datos sino por la indicada en una serie de
ficheros XML que definen la agrupacin visual de indicadores.
En el fichero XML se especificar el cdigo del indicador, los espacios para los que
se quiere visualizar y los tipos de grficos que lleva asociados. Para definir el orden
y las caractersticas de visualizacin el XML hace uso de los siguientes atributos de
la etiqueta serie:
Atributo Significado
espazo-visible- Grupos de espacio separados por ; que se visualizan en la
grupos pgina principal
Elementos individuales de espacio separados por ; que se
espazo-visible-items
visualizan en la pgina principal
espazo-visible-graf- Grupos de espacio separados por ; que se visualizan en el
grupos grfico
espazo-visible-graf- Elementos individuales de espacio separados por ; que se
items visualizan en el grfico
grafico Tipo de grfico. 1 Grfico de lneas, 2 Grfico de barras
Grupos de espacio separados por ; que se mostrarn en el
ambito-mapa
mapa
<serieespazo-visible-grupos="ga;esg;eu28g" grafico="1">TRAB_TOCUP64_T</serie>
10
- en los indicadores de gnero se visualizan tres grficos (uno para hombres, otro
para mujeres y otro en el que se comparan hombres y mujeres para el mbito
espacial de Galicia).
- en el caso de que se visualice un mapa, ser posible tambin la visualizacin de
un grfico (de lneas o de barras). Adems, los espacios que se representan en
el mapa no tienen que ser los mismos que los que se representan en el grfico.
Descarga de datos: al pulsar sobre el icono de la tabla se muestran los datos del
indicador para todos los espacios y todos los perodos para los que est grabado y
se posibilita la descarga de los datos en formato .xls ou .csv.
11
3. Nuevos productos en la web del IGE que facilitan la
interoperabilidad: widgets y APIs
12
Principales indicadores grficos de Galicia:
http://www.concellos.info
http://www.economiadigital.es/gles/
13
http://www.certo.es
http://www.sectorticgalicia.com
http://partidopopulardemelide.blogspot.com
http://cemitaguarda.blogspot.com
http://www.ferrol.es/90-52widgets_ige.aspx
Estos seran los widgets estndar que el IGE tiene a disposicin de todos los
usuarios en la web. De todos modos, internamente tenemos ms y estamos
abiertos a peticiones especficas. Dos casos particulares de peticiones especficas de
widgets son los incorporados en la pgina web de un proyecto europeo denominado
Symbios: Crisis demogrfica, territorios habitables e inclusin y en la pgina web
de Confemadera Galicia, la patronal de la madera en Galicia.
http://www.proxectosymbios.eu/gl/content/retrato_socio_demogr%C3%A1fico
http://confemaderagalicia.es/?page_id=1670
Adems de todo lo comentado sobre los widgets y para mejorar el acceso a los
datos y fomentar la innovacin, el IGE expone, tambin, su informacin a travs
de dos interfaces de Programacin de Aplicaciones (APIs). De esta manera los datos
estn accesibles a los desarrolladores de software a travs de una peticin HTTP
GET. A partir de estas APIs, los desarrolladores pueden obtener informacin del
Instituto e integrarla en sus propios servicios. La utilizacin de cualquiera de las
APIs conlleva la aceptacin de unas condiciones de uso del servicio.
En las dos APIs, el IGE ofrece una aplicacin (constructor de URLs) para configurar
la informacin que cada usuario precise. En esta aplicacin se muestra la URL
desde la cual se puede tener acceso a esa seleccin (peticin) y los desarrolladores
podrn utilizar directamente estas URLs en sus aplicaciones. Toda la informacin
que se especifica en la peticin est contenida en la URL, por lo que basta con
copiarla. Tambin se pueden construir URLs similares para obtener otras
extracciones de datos cambiando algn parmetro. Para el caso de la dimensin
temporal, ya est habilitada la posibilidad de pedir, no una serie de perodos
concreta, sino tambin los ltimos que existan en las bases de datos del IGE. Los
formatos de respuesta son .csv y .json
14
Constructor de URL:
Url de descarga de los datos seleccionados
Acceso a la interfaz:
http://www.ige.eu/igebdt/esq.jsp?idioma=gl&ruta=navIndApi.jsp
Constructor de URL:
Url de descarga de los datos seleccionados
15
Como ya se coment los formatos de respuesta son dos: .csv y .json. Se ofrece la
posibilidad de descarga en .csv por ser este un formato muy simple, abierto, bien
conocido y soportado por todos los programas de hojas de clculo y adecuado para
la informacin de carcter tabular.
La estructura del fichero .csv se caracteriza por contener en la primera lnea los
nombres de las variables y las lneas siguientes contienen los clasificadores,
separados por comas. Las variables de tipo alfanumrico van entre comillas.
"CodTempo","Tempo","Poboacin e
densidade","CodEspazo","Espazo","DatoN","DatoT"
1950,"1950","Poboacin","12","12 Galicia",2701803,"2.701.803"
1960,"1960","Poboacin","12","12 Galicia",2730996,"2.730.996"
Se ofrecen tambin los datos en formato .json por ser este un formato ligero para
el intercambio de datos. Es simple y ampliamente empleado y apoyado ya que los
principales lenguajes de programacin pueden manejar .json.
{"variables" :
["indicador","codespazo","espazo","codtempo","tempo","datoN","datoT"
],"datos" : ["POB","12","12
Galicia","2009","2009","2767474","2.767.474"]
,["POB","12","12 Galicia","2010","2010","2772457","2.772.457"]
16
4. Publicacin dinmica de estudios de carcter transversal y
resmenes de resultados: Panorama rural-urbano, Panorama de los
siete grandes municipios o Estudio de salarios
Es habitual que los datos estadsticos no aparezcan de manera aislada y para que
tengan coherencia se deben presentar correctamente, dndole una orientacin clara
a aquello que se quiere transmitir. Los formatos tradicionales de difusin de
informacin estadstica, en forma de datos tabulados, proporcionan gran cantidad
de informacin que en muchos casos no es manejable para todos los perfiles de
usuarios. En muchas ocasiones el usuario de informacin estadstica demanda una
contextualizacin de los datos, as como grficos y/o mapas que ayuden a la
comprensin de los mismos. Los resmenes de resultados incorporados en algunas
de las operaciones ayudan al usuario a tener una visin global de dicha operacin y
resaltan los aspectos ms destacables de cada estadstica.
17
Para implementar estas publicaciones se opt por combinar lenguaje html y
sentencias javascrip con la descarga de datos mediante las APIs del IGE. As nos
convertimos al mismo tiempo en proveedores y usuarios de la informacin
disponible en la pgina web en forma de APIs.
En el caso de los estudios transversales, tanto los grficos como las tablas de datos
que incorporan se nutren directamente de las distintas bases de datos, es decir, si
cambiamos un dato en la base de datos donde est almacenado, automticamente
se actualizar en la publicacin la tabla o grfico que lo contenga.
Si queremos mostrar una tabla o grfico cuyos datos se ubican en una nica tabla
de la base de datos de tablas multidimensionales, como en el que se muestra en la
Imagen 14 realizado para el Panorama rural-urbano, utilizamos unos scripts
programados en javascript y desarrollados por el Servicio de Informtica del IGE.
18
Imagen 15. Pirmides de poblacin superpuestas
En el caso de las tablas de datos, se pueden mostrar todas las categoras de las
variables o un subconjunto y es posible mostrar columnas calculadas a partir de las
originales. El clculo de columnas calculadas resulta muy til cuando la informacin
que se quiere mostrar se refiere a variaciones en el tiempo o porcentajes que no
estn grabados en la base de datos como variables independientes, como ocurre en
la contextualizacin del mercado laboral, en el estudio sobre salarios:
<script language="javascript" src="http://www.ige.eu/igebdt/marcotabla?
op=1&w=870&h=150&tf=13&np=0&cod=6331&r=1[all]&c=9924[all];2[all]&f=0:2012&cc=Porcentaxe Mulleres
Galicia=6/n389,4*n100|Porcentaxe Homes Galicia=5/n414,1*n100|Porcentaxe Galicia=4/n803,4*n100|Porcentaxe
Espaa=1/n14241,8*n100"></script>
Imagen 16. Estudio sobre salarios: Tabla de datos con columnas calculadas
19
Sin embargo, para poder utilizar la API de Google Charts recuperando informacin
directamente desde la web del IGE se tuvieron que desarrollar dos funciones en
javascript cuya combinacin permite la lectura de datos de la web mediante la API
del IGE, realizar los clculos necesarios para obtener la informacin que se quiere
mostrar (calcular porcentajes, tasas de variacin, etc.); y su representacin con un
formato adecuado.
Lectura de datos
Construccin de una
tabla temporal con los
datos a representar
20
c) Representacin grfica: Fijamos los parmetros del grfico y representamos los
datos de la tabla temporal
En este caso, se opt por difundir los datos de los siete grandes municipios de
Galicia en forma de tablas y grficos, mientras que para las secciones y distritos
censales de estos municipios se incorporaron mapas representativos.
a) Informacin para municipios:
21
b) Informacin por distritos y secciones censales:
Tanto las secciones como los distritos censales se identifican mediante cdigos
numricos que por s solos no aportan la informacin necesaria para localizarlos. La
representacin en un mapa fijo nos permite visualizar la distribucin de las
variables e identificar patrones en funcin de su distribucin geogrfica, pero aun
as, en el caso de los datos por distritos y, sobre todo, en los datos por secciones
censales, dado el tamao y distribucin de stas, resulta difcil identificar y/o
reconocer zonas concretas, que por otra parte es precisamente lo que demandan
los usuarios. A menudo nos encontramos con consultas de ciudadanos o medios de
comunicacin interesados en conocer datos de barrios o zonas determinadas.
Imagen 21. Mapas fijos para secciones y distritos censales generados con R
Pinchando sobre los mapas fijos que representan las distintas variables en las
secciones o distritos censales se accede al correspondiente mapa interactivo de
Google maps.
22
Imagen 22. Mapa interactivo de Google maps
En esta aplicacin se pueden consultar directamente los datos mostrados sobre el
mapa (Ver datos representados) o los datos de las secciones o distritos que se
desee (situndose encima y pinchando con el ratn se muestran el cdigo del
distrito o seccin censal seleccionada y el valor que toma la variable consultada en
dicha seccin o distrito).
Adems, en todos los estudios publicados se facilitan los enlaces a las tablas de
datos para la consulta de los mismos en forma de tabla multidimensional, con todas
las funcionalidades que ofrecen este tipo de tablas (descarga de datos en Excel o
csv, generacin de grficos desde la aplicacin de la web, acceso a definiciones,
metodologas etc).
23
5. Conclusiones
Aunque son pocos los datos de los que disponemos actualmente para ver el
impacto de esta nueva forma de difusin de la informacin, a la luz de la
informacin que existe hasta el momento, pensamos que podemos seguir
trabajando en esta lnea, pues se logra que la informacin estadstica se utilice en
mbitos diferentes a los que se estaba usando.
Ya por ltimo, resaltar la repercusin de los estudios transversales, puesto que son
productos que tienen mucha aceptacin por parte de los medios de comunicacin y
estos contribuyen a que sean ampliamente difundidos.
24
6. Bibliografa
25