You are on page 1of 4

Artculo especial

El software libre en la investigacio n me dica


The free software in medical research
Teresa Seoane Pillado
a
, Miguel A

ngel Rodrguez Munos


b,
, Xurxo Hervada Vidal
b
y Carmen Cadarso Sua rez
c
a
Unidad de Epidemiolog a Cl nica y Bioestad stica, Complejo Hospitalario Universitario A Coruna, A Coruna, Espan a
b
Direccion Xeral de Saude Publica e Planicacion, Conseller a de Sanidade, Xunta de Galicia, Santiago de Compostela, Espan a
c
Unidad de Bioestad stica, Facultad de Medicina, Universidad de Santiago de Compostela, Santiago de Compostela, Espana
I N F O R M A C I O

N D E L A R T I

C U L O
Historia del art culo:
Recibido el 8 de septiembre de 2009
Aceptado el 22 de octubre de 2009
Un problema cla sico a la hora de utilizar programas informa -
ticos para la realizacio n de estudios biome dicos consiste en que
asumimos el elevado coste del software propietario
d
, y no lo
consideramos un handicap o un punto para tener en cuenta a la
hora de evaluar su conveniencia. Esta situacio n provoca un sesgo
en el panorama del software especializado, y claramente inclina la
balanza hacia el lado del software comercial. Adema s del precio de
la adquisicio n de estos programas, hay que anadir su coste
del mantenimiento. Casi todos los productos poseen una poltica
de licencias
14
que provoca que, anualmente, tengamos la
necesidad de renovarlos (incluso no permiten continuar utilizan-
do las versiones anteriores).
En resumen, por un lado, a nivel empresarial, nos estamos
acostumbrando a )arrendar* los paquetes de software que se
utilizan habitualmente en la realizacio n de estudios biome dicos, y
por otro lado, a nivel particular, utilizamos de forma fraudulenta
()pirateo*) el software empresarial (en el caso concreto que nos
ocupa, se estima que el uso )pirata* que se realiza de este tipo de
programas sirva como ejemplo el SPSS es de un 80% del total
del software biome dico).
Una tarea importante, desde el punto de vista funcional, sera
la de acometer la eliminacio n de situaciones de dependencia
tecnolo gica generadas por este tipo de estrategias. Se debe
considerar la independencia del software de terceras partes, el
acceso completo y abierto a sus funcionalidades y la posibilidad
de modicacio n/adaptacio n de e ste como un valor anadido a la
hora de seleccionar las herramientas de referencia para la
realizacio n de estudios me dicos, bioestadsticos, epidemiolo gicos
o de salud en general.
Por otro lado, es necesario considerar que estamos viciando el
propio sistema a la hora de elegir indiscriminadamente, desde un
punto de vista econo mico, los programas para utilizar, que
estamos inuyendo, de una manera indirecta, en las herramientas
de software para futuros estudios y estamos delimitando el campo
de accio n de los estudiantes (futuros profesionales del sector) y
los nuevos investigadores, y as conseguimos marcar tendencias
en la docencia y la investigacio n, que vuelven a retroalimentar el
bucle.
Adema s de todo esto, el panorama actual del software
necesario para la realizacio n de estudios de salud pasa por la
necesidad de homogeneizar el entorno de trabajo, que hoy en da
consiste en la utilizacio n de ma s de un programa simulta nea-
mente y, en ciertos casos, un nu mero elevado de ellos; algunos de
e stos esta n disponibles en sistemas operativos distintos (como
pueden ser, por ejemplo, Windows o Linux), y que aumentan,
todava ma s, el coste indirecto imputado a la realizacio n de este
tipo de estudios, adema s de crear un statu quo heteroge neo que
no favorece la evolucio n de los sistemas de software ni la
posibilidad de incorporacio n de nuevas rutinas o programas de
fa cil acceso y utilizacio n por parte de la comunidad cientca.
Veamos un ejemplo
Un profesional sanitario quiere realizar un estudio clinicoepi-
demiolo gico que consiste en evaluar el riesgo de una enfermedad
ARTICLE IN PRESS
www.elsevier.es/medicinaclinica
0025-7753/$ - see front matter & 2009 Elsevier Espana, S.L. Todos los derechos reservados.
doi:10.1016/j.medcli.2009.10.045

Autor para correspondencia.


Correo electronico: miguel.angel.rodriguez.muinos@sergas.es
(M.A. Rodrguez Munos).
d
El software propietario o privativo, tambie n llamado de co digo cerrado, se
dene como el software del que el usuario tiene limitada la posibilidad de usarlo,
modicarlo, distribuirlo o disponer de su co digo fuente por estar restringido por
sus autores, ya sean personas fsicas o empresas; mientras que el software
comercial es aquel por el que las companas que lo producen cobran dinero para
permitir su utilizacio n.
Med Clin (Barc). ]]]];](]):]]]]]]
Co mo citar este artculo: Seoane Pillado T, et al. El software libre en la investigacio n me dica. Med Clin (Barc). 2009. doi:10.1016/
j.medcli.2009.10.045
en pacientes con cierta caracterstica comu n. Para esto, lleva a
cabo un estudio epidemiolo gico transversal descriptivo. Para
realizar este estudio recoge en una base de datos disenada con
el software propietario y comercial )S* los datos de la muestra
seleccionada; posteriormente realiza el ana lisis estadstico con
ese mismo programa comercial. Finalmente, el clnico recoge e
interpreta los resultados obtenidos en un artculo con el n de
aportar informacio n de intere s para la comunidad cientca.
Adema s de esto, el cientco en cuestio n elabora una presen-
tacio n con la que pueda comunicar en cierto congreso, de forma
adecuada, la realizacio n de este estudio y de los datos obtenidos en
e l. Para esto utilizara el software propietario y comercial )P*.
Para nalizar, el mismo investigador, esta vez en calidad de
docente, aprovechara su estudio (y la presentacio n de la
comunicacio n de e ste) para explicarles a sus alumnos el trabajo
cientco realizado y los datos obtenidos, adema s de formarlos en
las te cnicas adecuadas para la realizacio n de ese tipo de estudios.
Los alumnos adquieren el conocimiento de la utilidad del software
)S* (y del software )P*, colateralmente).
En el futuro, cuando los alumnos pasen a formar parte de la
comunidad cientca, podra n realizar sus propios estudios, para
los que tendra n como software de referencia los mencionados
programas propietarios )S* y )P*. En ese momento puede que se
encuentren con alguno de estos 2 problemas, o con ambos: que
necesiten adquirir licencias de los programas )S* y )P* o que no
puedan modicar estos programas para realizar cierto tipo de
ca lculos que, a mayores, se necesiten en este caso concreto.
Alternatinas al software propietario
La alternativa al software comercial es el software libre
5
.
Podemos denir )software libre* como aquellos programas de
ordenador de los que disponemos del co digo fuente y de la
posibilidad, contemplada en la licencia de e ste, de modicarlo o
adaptarlo segu n nuestras necesidades y poder redistribuirlo
posteriormente
613
.
Segu n la denicio n de la Free Software Foundation
e
, el software
libre se reere a la oportunidad de los usuarios para utilizar,
distribuir y modicar el software sobre la base de 4 libertades
14
:
la libertad de usar el programa, con cualquier propo sito;
de estudiar y adaptar el programa segu n las necesidades de
cada uno;
de distribuirlo libremente,
y de modicar el programa y hacer pu blicas las modicaciones,
de modo que toda la comunidad se benecie.
La forma de ofrecer un programa como software libre consiste en
ponerlo a disposicio n de la comunidad con una licencia anexa, de
forma que el autor o autores de e ste provean a los interesados una
manera de realizar )actuaciones legales* sobre estos programas.
Desde el punto de vista del software libre, existen distintos tipos de
licencias. Una de las ma s extendidas es la licencia GPL
f
(General
Public License), cuya primera versio n vio la luz en la de cada de
1980. Esta licencia posibilita la utilizacio n, la modicacio n y la
redistribucio n del software y obliga a que siga mantenie ndose este
tipo de licencia en las versiones modicadas. Se estima que ma s del
50% de las licencias de software libre son GPL.
EpiLinux
EpiLinux
15
es un software libre, distribuido bajo licencia GPL.
Es un sistema operativo, de libre distribucio n, especialmente
orientado a la utilizacio n de herramientas de ana lisis epidemio-
lo gico y bioestadstico.
Pretende aportar un sistema completo y auto nomo, de sencillo
manejo y de utilidad para todas aquellas personas, tanto
profesionales como estudiantes, que desarrollen sus actividades
en los campos de la epidemiologa, la bioestadstica y los estudios
de salud en general. Para esto, se ha recopilado en una misma
distribucio n y con un entorno homoge neo el software necesario
para realizar estudios completos de salud, bioestadsticos o
epidemiolo gicos.
En la gura 1 se puede observar el entorno de trabajo de
EpiLinux.
Caractersticas te cnicas
EpiLinux es una distribucio n completa de Linux. Esta basado en
Ubuntu, con entorno de escritorio KDE en su versio n 3, en la que
se ha incluido, entre otros programas, una recopilacio n de
software para la realizacio n de estudios de salud: desde herra-
mientas oma ticas (OpenOfce), software de Internet (por
ejemplo, Firefox,) hasta software especco epidemiolo gico de
ana lisis de datos y bioestadstico (R, SciLab, Octave, PSPP,
WinBUGS, OpenStat, EpiGrass o Quantum GIS).
En cuanto al software especco para la realizacio n de estudios
de salud, cabe destacar que R
16
es el software de referencia de
propo sito general
17
.
Adema s, podremos disponer de PSPP
18
, un software compatible
con los datos y las rutinas de SPSS. Ana logamente, contamos con
Octave como la alternativa libre de Matlab.
Emulador WINE
Como complemento al software nativo, EpiLinux dispone del
emulador WINE
g
(http://www.winehq.org/), que permite ejecutar
el software disenado para Windows en su propio entorno.
Funciona como un cargador para Linux de programas basados
en las API Win16 y Win32.
EpiLinux se puede utilizar como un sistema live y ejecutar
directamente desde el DVD, lo que evita la interaccio n con
instalaciones previas de otros sistemas operativos. Tambie n se
puede instalar en el disco duro del equipo. Esta disponible para su
descarga desde la web de la Direccio n Xeral de Sau de Pu blica e
Planicacio n (http://www.galiciasaude.es/dxsp) gratuitamente,
en su apartado de portada Informacio n destacada.
Caso pra ctico
Utilizaremos el ejemplo expuesto anteriormente para realizar
el estudio con las herramientas de software libre que nos
proporciona EpiLinux. Tenemos una base de datos que necesi-
tamos manipular; si la base esta en formato SPSS o tenemos
ARTICLE IN PRESS
e
La Free Software Foundation (http://www.fsf.org/) es una organizacio n
creada por Richard Stallman, en la de cada de 1980, con el propo sito de difundir el
software libre. Referencia en Wikipedia: http://es.wikipedia.org/wiki/Free_Software_
Foundation [consultado 14/7/2009].
f
La licencia GPL es un proyecto creado por la Free Software Foundation para
proteger el uso, la modicacio n y la distribucio n del software libre. Referencia en
Wikipedia: http://es.wikipedia.org/wiki/GPL [consultado 16/7/2009].
g
WINE es un acro nimo recursivo que signica Wine Is Not an Emulator (Wine
no es un emulador). Referencia en la Wikipedia: http://es.wikipedia.org/wiki/Wine
[consultado 17/7/2009].
T. Seoane Pillado et al. / Med Clin (Barc). ]]]];](]):]]]]]] 2
Co mo citar este artculo: Seoane Pillado T, et al. El software libre en la investigacio n me dica. Med Clin (Barc). 2009. doi:10.1016/
j.medcli.2009.10.045
rutinas escritas especcamente para este paquete de software se
recomienda la utilizacio n de PSPP para la realizacio n de las
operaciones ba sicas de ana lisis descriptivo, regresio n lineal y no
parame tricas. En cualquier otro caso, la eleccio n que haremos sera
la de R, por ser un paquete de software estadstico de propo sito
general que nos permitira importar los datos y manipularlos
directamente desde el sistema de menu s de su entorno gra co
(habitualmente R Commander
19
o RKward
20
).
En la gura 2 se puede ver la pantalla principal de R
Commander, en la que observamos las opciones del menu
)Estadsticos*, como son resu menes, tablas de contingencia,
medias, proporciones, varianzas, test no parame tricos, ana lisis
dimensional y ajustes de modelos (regresio n lineal, modelo lineal,
modelo lineal generalizado, modelo logit multinomial y modelo
ordinal de regresio n).
R es un software muy versa til que, adema s de posibilitar su
manejo desde el entorno gra co, nos permite la introduccio n directa
de instrucciones y la lectura de programas completos almacenados
en cheros de texto. Adema s del potente lenguaje de programacio n
que incorpora, podemos cargar nuestras propias rutinas o packages
de terceros que nos permitira n ampliar la capacidad del programa.
Existen repositorios ociales de packages en los que se encuentran
amplias colecciones de rutinas de todo tipo. El repositorio ocial se
llama the Comprehensive R Archive Network (CRAN). En e l podemos
encontrar alrededor de unos 1.500 paquetes que nos permitira n
incorporar a R capacidades (valgan algunas de ejemplo) como la
elaboracio n y la manipulacio n de mapas, el tratamiento de bases de
datos, la econometra, la geno mica, el ana lisis logene ticos, la
estadstica bayesiana, el procesado de ima genes o el clustering.
En determinados casos necesitaremos complementar nuestro
estudio con la publicacio n de mapas (incidencia, tasas ajustadas),
tarea para la que esta especialmente indicado el programa
Quantum GIS, compatible con los programas esta ndares de
sistemas de informacio n geogra ca (shapes de ArcGIS, tablas y
mapas de MapInfo).
Una vez que hemos realizado el estudio deseado, podemos
continuar utilizando las herramientas de software libre que nos
proporciona EpiLinux para la elaboracio n del informe o el artculo
correspondiente (con OpenOfce Write) y su presentacio n en
diapositivas (con OpenOfce Impress). En la gura 3 se muestran
ARTICLE IN PRESS
Figura 1. Escritorio de EpiLinux, donde se puede observar la barra de tareas en la parte inferior y los conos de acceso directo en los laterales de la pantalla.
Figura 2. Ventana principal de R Commander.
T. Seoane Pillado et al. / Med Clin (Barc). ]]]];](]):]]]]]] 3
Co mo citar este artculo: Seoane Pillado T, et al. El software libre en la investigacio n me dica. Med Clin (Barc). 2009. doi:10.1016/
j.medcli.2009.10.045
2 de los programas integrados en la suite oma tica OpenOfce:
Writer como procesador de textos e Impress como programa de
presentaciones.
As pues, la realizacio n de estudios biome dicos con software
libre es posible (y recomendable). EpiLinux ofrece la posibilidad
de disponer, en un entorno completo, homoge neo y de libre
distribucio n, de las herramientas necesarias para la realizacio n de
estudios epidemiolo gicos, bioestadsticos y de salud en general.
Financiacio n
El proyecto EpiLinux surge de la colaboracio n entre la
Direccio n Xeral de Sau de Pu blica e Planicacio n de la Consellera
de Sanidade, Xunta de Galicia, y la Unidad de Bioestadstica de
la Facultad de Medicina, Universidad de Santiago de Compostela,
a trave s de los proyectos de investigacio n MTM2005-00818 y
MTM208-01603 del Ministerio de Ciencia e Innovacio n.
Agradecimientos
Los autores agradecen al profesor Eric Cobo todas sus
sugerencias y consejos, que han contribuido a mejorar los
contenidos y la presentacio n de este manuscrito.
Bibliografa
1. Abad M. GNU Project. Diversas licencias y comentarios sobre ellas
[consultado 10/7/2009]. Disponible en: http://www.gnu.org/licenses/license-
list.es.html.
2. Microsoft Corporation. Perspectiva General de las Licencias [consultado 10/7/
2009]. Disponible en: http://www.microsoft.com/spain/sharedsource/Articles/
LicensingOverview.mspx.
3. Open source initiative. Licenses by name [consultado 10/7/2009]. Disponible
en: http://www.opensource.org/licenses/alphabetical.
4. Wikipedia. Licencia de software [consultado 10/7/2009]. Disponible en: http://
es.wikipedia.org/wiki/Licencia_de_software.
5. Mas i Herna ndez J. Software libre: te cnicamente viable, econo micamente
sostenible y socialmente justo [consultado 14/7/2009]. Disponible en: http://
www.infonomia.com/img/pdf/llibrejmas.pdf.
6. Bessen J. What good is free software? En: Hahn R, editor. Government Policy
toward. Open source software. Washington, DC: AEI-Brookings Joint Center for
Regulatory Studies; 2002.
7. Lerner J, Tirole J. The open source movement: Key research questions. Eur Econ
Rev. 2001;45:81926.
8. DiBona C, Ockman S, Stone M. Open sources: Voices from the open source
revolution. Sebastopol, CA: Eds. OReilly & Associates; 1999.
9. Raymond ES. The magic cauldron 1999 [consultado 15/7/2009]. Disponible en:
http://www.catb.org/esr/writings/magic-cauldron/.
10. Raymond ES. The cathedral and the bazaar 2000 [consultado 15/7/2009].
Disponible en: http://www.catb.org/esr/writings/cathedral-bazaar/.
11. Stallman R. Free as in freedom. 2002 [consultado 17/7/2009]. Disponible en:
http://www.oreilly.com/openbook/freedom/.
12. Gonza lez JM, Heras P, Matella n V, Martnez G. Sobre software libre.
Compilacio n de ensayos sobre software libre. Madrid, 2004 [consultado 17/
7/2009]. Disponible en: http://gsyc.es/grex/sobre-libre/index.html.
13. Libro Blanco del software libre en Espana [consultado 17/7/2009]. Disponible
en: http://www.libroblanco.com.
14. Stallman R. Free Software, Free Society. GNU Press, 2002 [consultado 18/7/
2009]. Disponible en: http://biblioweb.sindominio.net/pensamiento/softlibre/
softlibre.pdf.
15. EpiLinux [consultado 18/7/2009]. Disponible en: http://www.galiciasaude.es/
dxsp. Blog [consultado 18/7/2009]. Disponible en: http://epilinux.blogspot.
com. Video y presentacio n [consultado 18/7/2009]. Disponible en: http://
www.whyoss.com/es/conference/madrid09/program/171.
16. R [consultado 18/7/2009]. Disponible en: http://www.r-project.org/.
17. Arriaza AJ, Ferna ndez F, Lo pez MA, Munoz M, Pe rez S, Sa nchez A. Estadstica
ba sica con R y R-Commander. Universidad de Ca diz 2008.
18. PSPP [consultado 18/7/2009]. Disponible en: http://www.gnu.org/software/
pspp/.
19. R Commander [consultado 18/7/2009]. Disponible en: http://socserv.mcmas
ter.ca/jfox/Misc/Rcmdr/.
20. RKward [consultado 18/7/2009]. Disponible en: http://rkward.sourceforge.
net/.
ARTICLE IN PRESS
Figura 3. Dos de los programas integrados en la suite oma tica OpenOfce: Writer como procesador de textos e Impress como programa de presentaciones.
T. Seoane Pillado et al. / Med Clin (Barc). ]]]];](]):]]]]]] 4
Co mo citar este artculo: Seoane Pillado T, et al. El software libre en la investigacio n me dica. Med Clin (Barc). 2009. doi:10.1016/
j.medcli.2009.10.045

You might also like