You are on page 1of 9

3.

Almacenamiento y recuperacin de informacin bibliogrfica

3.1- Almacenamiento de la informacin


3.2- Centros bibliotecarios y centros de documentacin. Los sistemas de
teledocumentacin.
3.3- Recuperacin de la informacin. Estrategias de bsqueda.

3.1- Almacenamiento de la informacin


La documentacin se puede encontrar sobre una gran diversidad de soportes. Histricamente la
escritura ha sido el testimonio si no nico s fundamental sobre el que se ha levantado nuestro
conocimiento del pasado. Sin embargo, en el presente junto a los textos manuscritos o impresos en papel
encontramos microfilmes, microfichas, cintas de audio y vdeo, videodiscos, pelcula fotogrfica y
soportes magntico. Todos son documentos, todos contienen informacin, pero la diferente naturaleza del
material sobre el que se mantiene exige, por sus cualidades fsicas, un diferente almacenamiento y tambin
un mtodo de descripcin diferente:

SOPORTE LOCALIZACION_________________
Manuscritos e impresos Archivos
Libros y folletos Bibliotecas
Revistas y peridicos Hemerotecas
Informticos Bases y bancos de datos
Audiovisuales Fonotecas, videotecas, filmotecas

Hasta del desarrollo de los sistemas automatizados, los repertorios impresos, bibliogrficos o de
resmenes, eran los que actuaban como depsitos de informacin. La aplicacin de la informtica en las
tareas de documentacin cientfica ha dejado progresivamente en desuso esos sistemas.
Para estudiar como se almacena la informacin y como se puede recuperar, debemos distinguir en
primer lugar los tipos de centros de informacin y documentacin:
* Las bibliotecas son sistemas de informacin documental cuyo objeto es permitir a sus
usuarios acceder directamente o por s mismos a documentos primarios (libros, revistas, obras
de consulta, etc.)
* Los centros de documentacin son sistemas de informacin documental que tienen como
objetivo principal poner a disposicin de los usuarios documentos secundarios (ficheros,
boletines bibliogrficos, ndices, etc.) que les permitan descubrir los documentos primarios que
les interesen.
* Los sistemas de teledocumentacin, las bases y bancos de datos, constituyen un sistema
de informacin documental que se caracteriza por utilizar medios informticos para el
almacenamiento y el suministro a los clientes de una amplia gama de servicios informativos.

1
Introduccin a la Investigacin Biolgica
Curso 2009-2010
Jos Juan del Ramo Romero, Javier Nez de Murga, Manuel Nez de Murga, Jose Pertusa Grau
Todos los centros de documentacin e informacin tienen en comn el ser organismos intermedios
en la labor de documentacin, en cuanto a que su finalidad fundamental es acumular documentos
informativos que despus se ponen a disposicin del pblico.
3.2- Centros bibliotecarios y centros de documentacin. Los sistemas de
teledocumentacin.

* Centros bibliotecarios
Segn Nuria Amat (1982), biblioteca es toda coleccin organizada de libros, publicaciones
peridicas u otros documentos cualesquiera (en especial grficos y audiovisuales), as como los servicios del
personal, que facilita a los usuarios la utilizacin de estos documentos con fines informativos, de
investigacin, de educacin o recreativos.
Las bibliotecas constituyen, pues, sistemas de documentacin en los que las entradas son los
documentos que constituyen el fondo bibliogrfico de la biblioteca, y las salidas los servicios que las
bibliotecas prestan al pblico, para facilitar la informacin bibliogrfica y el acceso a los documentos
primarios.
A pesar de la aparicin moderna de los centros de documentacin y de los bancos de datos, las
bibliotecas siguen siendo sistemas de documentacin de obligada utilizacin en la labor de localizacin y
consulta de diversos tipos de fuentes utilizados en la elaboracin de trabajos cientficos, y de modo especial
en los estudios retrospectivos y de tipo histrico referidos a pocas no abarcadas en los centros de
documentacin.
Destacar en este punto que son cada vez ms las bibliotecas que estn conectadas a redes
informticas, lo que permite al investigador consultar los catlogos sin la presencia fsica en dicha
biblioteca. Esto da acceso a un nmero enorme de bibliotecas de todo el mundo (ej. HYTELNET).

* Los centros de documentacin


La multiplicidad de fuentes de informacin que existe y se produce en las sociedades hizo necesaria,
ya desde muy antiguo, la existencia de centros especializados para su recogida, almacenamiento y puesta a
disposicin de los usuarios. De ellos son buenos ejemplos la bibliotecas.
La revolucin actual en la informacin y las comunicaciones informativas, con la multiplicidad de los
medios utilizados y la amplitud enorme de material informativo que continuamente se est produciendo en el
mundo moderno, ha hecho que las bibliotecas ya no sean suficientes. Ello dio lugar al nacimiento, alrededor
de los aos 50, de los centros de documentacin y sus tcnicas, orientados a recoger, ordenar, clasificar
y proporcionar a los usuarios toda esa masa enorme de informacin que en las sociedades actuales se
encuentra desperdigada en un incontable nmero de documentos de todo tipo.

2
Introduccin a la Investigacin Biolgica
Curso 2009-2010
Jos Juan del Ramo Romero, Javier Nez de Murga, Manuel Nez de Murga, Jose Pertusa Grau
Estos centros pueden tener:
* carcter nacional o internacional
* carcter general o especializado, limitado por tanto a un determinado campo de la ciencia o de
la tcnica
* carcter no autnomo, dependiente de empresas, centros de investigacin, asociaciones
profesionales, lo que no obsta para que puedan suministrar tambin informaciones particulares.
De todas formas, los centros de documentacin no suelen ser generales (como frecuentemente son
las bibliotecas), sino especializados. La mayora cumplen todos o algunos de los siguientes cometidos
respecto a los documentos: su identificacin, registro, organizacin, almacenamiento, recuperacin,
conversin en formas tiles, su sntesis y su diseminacin entre los usuarios, preferentemente en forma de
resmenes de los documentos y listas de referencias bibliogrficas y documentales.
En cuanto a su definicin, segn la UNESCO, los centros de documentacin estn constituidos por
grupos de personas que se dedican de lleno al procesamiento de documentacin relativa a un cierto campo
o tema, a fin de proveer regularmente informacin abreviada a una comunidad de usuarios especializados.
Las formas de difusin de la informacin utilizadas por los centros de documentacin son mltiples.
Entre ellas, las ms habituales son:
* Notas bibliogrficas
* Informaciones sobre obras recibidas
* Resmenes analticos
* Informes y resmenes temticos
* Conferencias o extractos de conferencias, conclusiones de congresos, etc
* Filmes, emisiones de radio y televisin
* Publicaciones, manuales tcnicos, traducciones
* Artculos
Desde el punto de vista de la documentacin cientfica en el trabajo de investigacin, los servicios
que se pueden obtener de los centros de documentacin son:
* Proporcionar recopilaciones de documentos ya publicados acerca de un determinado tema.
Estas recopilaciones suelen denominarse bsquedas retrospectivas, dado que recogen
informacin documental fechada en tiempos pasados y no se ocupan de lo que pueda aparecer
con posterioridad.
* Mantener una informacin continuada al da sobre los documentos que van apareciendo
acerca de un determinado tema. Los sistemas de alerta mediante los que se realiza esta
distribucin selectiva de la informacin se ajusta a un perfil consistente en una serie de
palabras claves o descriptores que, separadamente o por combinaciones entre s, describen
con la mayor precisin posible el tema de que se trata. Los perfiles pueden ser elaborados por
los clientes o bien el mismo centro de documentacin puede ofrecer una serie de ellos para que
elijan aquellos.
* Suministrar reproducciones y traducciones, en su caso, de los documentos que interesen al
cliente.

3
Introduccin a la Investigacin Biolgica
Curso 2009-2010
Jos Juan del Ramo Romero, Javier Nez de Murga, Manuel Nez de Murga, Jose Pertusa Grau
* Los centros de documentacin importantes que poseen bases de datos suelen facilitar las cintas
magnticas cuyo contenido encierra la informacin almacenada por el centro. Permiten el establecimiento
de terminales con el ordenador de su base de datos. Adems, suelen publicar peridicamente boletines,
revistas de resmenes e ndices.
*Centros espaoles y extranjeros, caractersticas y servicios***Transparencia*

* Los sistemas de teledocumentacin. Bases de datos y bancos de datos.


Los sistemas de teledocumentacin aplican los ordenadores y las redes de telecomunicacin para
realizar las operaciones las operaciones y prestar los servicios propios de los sistemas de documentacin.
La extensin creciente de la aplicacin de la teledocumentacin encuentra su fundamento y
explicacin en la concurrencia de dos factores, uno de carcter documental y otro tcnico:
* La primera es la incapacidad de los sistemas tradicionales para abarcar la explosin
informativa tpica de nuestro tiempo y satisfacer las crecientes necesidades de informacin en
todos los campos de la vida.
* La circunstancia tcnica es la extraordinaria capacidad que muestran los modernos
procedimientos informticos para almacenar y difundir la informacin documental.
Los sistemas teledocumentales, constituyen grandes redes de comunicacin que facilitan el acceso
de terminales situados en centros de informacin y documentales, tales como universidades bibliotecas, etc.,
a las bases de datos documentales almacenadas en grandes ordenadores. Un rasgo tpico a destacar de un
sistema de este tipo es que, mientras los centros de documentacin y las bibliotecas constituyen sistemas
aislados o independientes, la telecomunicacin proporciona la oportunidad de conexin entre diversos
centros, lo que da lugar a que se formen redes documentales de mbito internacional.
Elementos de los sistemas de teledocumentacin
Los elementos que forman un sistema de teledocumentacin se pueden reunir en diferentes grupos:
* Elementos materiales
- Memorias.- Estn formadas por unidades de almacenamiento de datos, sobre discos o memorias
de acceso rpido.
- Ordenador central.- Permite la bsqueda de las informaciones en las unidades de
almacenamiento, mediante la utilizacin de programas de interrogacin.
Las memorias y el ordenador constituyen el servidor o host
- Mdem.- Modulador-demodulador. Transforma rdenes dadas al ordenador por el teclado de la
terminal y las respuestas del ordenador en impulsos elctricos transportables sobre las redes.
- Red telefnica.- Trabaja en tiempo compartido con el ordenador, prestando servicios a mltiples
clientes.
- Teclado.- Permite hacer las preguntas al ordenador y dialogar con este, mediante la utilizacin
del lenguaje.
- Impresora.- Imprime mecanogrficamente las ordenes dadas al ordenador y las respuestas de
este.
- Pantalla.- Permite visualizar sobre ella lo que se imprime en la impresora.
El teclado, la impresora y la pantalla forman en conjunto la terminal.

4
Introduccin a la Investigacin Biolgica
Curso 2009-2010
Jos Juan del Ramo Romero, Javier Nez de Murga, Manuel Nez de Murga, Jose Pertusa Grau
Este sistema clsico, aunque sigue funcionando, ha evolucionado a un sistema ms personalizado. En
la actualidad los usuarios pueden conectarse desde su propio ordenador personal al ordenador central a
travs de proveedores de red (INTERNET) o como veremos ms adelante ciertas instituciones (como
universidades o bibliotecas) permiten el acceso a bases de datos que reciben en formato CD-ROM. Dicho de
otra manera, la teledocumentacin no solo se limita a los grandes centros de informacin o instituciones.
* Elementos organizativos
A la complejidad tcnica de los sistemas de teledocumentacin corresponde una complejidad
administrativa, con relacin a los dems sistemas de documentacin. Mientras que en un sistema clsico,
como una biblioteca, una sola organizacin engloba sus diferentes servicios y departamentos, en los
sistemas de teledocumentacin los diversos servicios que implica suelen estar a cargo de organizaciones o
centros independientes.
Como elementos documentales organizativos de un sistema de teledocumentacin se pueden
distinguir los siguientes:
- Centros productores de bases y bancos de datos.
Los sistemas de teledocumentacin, como los dems sistemas de documentacin se
fundan en la recogida, tratamiento y almacenamiento de documentos. Cuando en
estos sistemas se habla de centros productores de bases de datos, se hace
referencia a centros, que pueden ser bibliotecas o centros de documentacin, que
realizan esta tarea de recoger, tratar y almacenar documentos bibliogrficos
(bases de datos) o datos numricos (bancos de datos), pero con la particularidad
de que disponen de ordenadores o soportes electrnicos para almacenar los
documentos y datos.
Se pueden resumir sus funciones en:
* Adquisicin de la informacin, que incluye la localizacin de datos
relevantes y de informacin auxiliar y la organizacin de esta adquisicin,
reproduccin, duplicacin y difusin subsiguiente.
* Proceso de la informacin preparndola para su distribucin y anlisis
(creacin de bases y bancos de datos).
* Mantenimiento de la informacin, asegurando la continuidad de los
datos y la documentacin en orden a prevenir irreparables prdidas de
informacin.
- Bases y bancos de datos.
Estn constituidos por el conjunto de ficheros electrnicos en los que los centros
productores de bases y bancos de datos almacenan la informacin documental
que han recogido y procesado. Todo documento procesado por uno de estos
centros, da lugar a un registro (record), compuesto por diversos elementos o
campos (autor, ttulo, editorial, etc.).
Un conjunto de registros referentes a la misma disciplina o asunto, da lugar a un
fichero (file). Finalmente, el conjunto de ficheros sobre distintos temas y

5
Introduccin a la Investigacin Biolgica
Curso 2009-2010
Jos Juan del Ramo Romero, Javier Nez de Murga, Manuel Nez de Murga, Jose Pertusa Grau
disciplinas de que dispone el centro productor, recibe el nombre de base de datos
o banco de datos.
Los trminos de base de datos y banco de datos se emplean a veces indistintamente,
pero se tiende a utilizar la expresin de base de datos para designar un conjunto
de ficheros de un centro de carcter bibliogrfico o textual, y la de banco de datos
para nombrar un conjunto de ficheros cuando contienen datos de carcter
numrico.
- Centros proveedores o distribuidores de bases y bancos de datos.
Los productores de informacin tienen la posibilidad de poner a disposicin de una
clientela restringida o del gran pblico un determinado nmero de informaciones,
pero no todos tienen los medios informticos para apoyar esta distribucin. Es por
ello que recurren a sociedades especializadas en el suministro de servicios
informatizados. Estas sociedades son los proveedores de bases y bancos de
datos. Son empresas pblicas o privadas que, con el apoyo logstico de los
ordenadores, ofrecen comercialmente la posibilidad de un acceso a un cierto
nmero de datos (propios o creados por otros). Estos centros reciben cintas
magnticas de los creadores de bases de datos y las reproducen en soporte
informtico (discos magnticos) que permite el acceso directo a la informacin
precisa.
- Empresas de redes de telecomunicacin.
Son las empresas privadas o pblicas que gestionan las lneas telefnicas nacionales
e internacionales las que unen entre s los dems elementos del sistema de
teledocumentacin. Estas redes son redes dedicadas a la transmisin de datos,
pero en la actualidad todo queda interconectado por INTERNET, una red de redes
que comunica prcticamente todo.
- Centros de acceso a bases y bancos de datos.
Son entidades pblicas o privadas que disponen de terminales, las cuales permiten
pedir informacin a las bases y bancos de datos. En este caso volvemos resaltar la
importancia de INTERNET en este tipo de conexiones por su universalidad.
- Redes de bibliotecas y centros de documentacin.
La proliferacin de bibliotecas y centros de documentacin desconectados entre s ha
dado lugar a la creacin de redes para coordinar su labor y evitar la dispersin y
duplicidad de tareas.
- Las bases de datos en CD-ROM
Otro gran avance en el campo de la telecomunicacin es el que representa el CD-
ROM siglas de compact disk, read only memory (disco compacto, con memoria
de slo lectura).
Se trata de discos susceptibles de lectura ptica por rayos lser digitalizada, que tiene
una enorme capacidad de almacenamiento de informacin, recuperable
simplemente mediante un ordenador personal.
6
Introduccin a la Investigacin Biolgica
Curso 2009-2010
Jos Juan del Ramo Romero, Javier Nez de Murga, Manuel Nez de Murga, Jose Pertusa Grau
Los CD-ROM suponen la posibilidad de disponer de una base de datos en el propio
domicilio del usuario. La recuperacin personal de la informacin contenida en el
CD-ROM solo precisa de un ordenador y un lector de CD-ROM.
No todo son ventajas, pues no puede olvidarse que el CD-ROM solo permite acceder
a una informacin cuya actualizacin depende de nuevas publicaciones de discos,
esto no es tan rpido como el acceso en lnea.
Destacar en este punto el comienzo del DVD, de tecnologa digital similar al CD-ROM
pero con un incremento enorme de capacidad (de unos 650 MB de un CD, a los
2,6 a 5,2 GB de un DVD)

3.3- Recuperacin de la informacin. Estrategias de bsqueda.


El proceso de recuperacin de informacin consiste esencialmente en extraer de una coleccin de
documentos aquellos que se ajustan a las especificaciones de un peticin determinada. Se trata pues de una
comparacin sistemtica entre los documentos o sus representaciones y la peticin o demanda de
informacin. Podemos descomponer el proceso en tres fases:
* Traduccin del documento en un lenguaje de indexacin. La expresin que resulta de este
proceso se llama modelo de bsqueda del documento. Se trata de representar el documento
por una serie de descriptores que lo determinen lo ms directamente posible para su posterior
bsqueda.
* Expresin de la peticin de informacin en el mismo lenguaje del modelo de bsqueda. Se
obtiene el denominado perfil de bsqueda.
* Comparacin sistemtica de los modelos de bsqueda de los documentos con el perfil de
bsqueda, a fin de seleccionar los que se ajusten a este.
La operacin resultara relativamente sencilla si los lenguajes de indexacin y de bsqueda
coincidieran exactamente. Ello, sin embargo, no es as en la mayora de los casos, ya que los productores
de bases de datos y repertorios bibliogrficos suelen indexar en lenguaje libre o semilibre, lo que resulta
mucho ms fcil y econmico para sus fines. Por tanto, al seleccionar los descriptores para la bsqueda,
habr que tener en cuenta todas las posibles formas de expresin de un concepto en la indexacin de los
documentos (sinnimos, conceptos ms generales y ms especficos, etc.) ya que de otro modo podran
perderse cantidades importantes de informacin. Por otra parte, si la seleccin es demasiado amplia, se
obtendrn documentos carentes de inters. De ah la importancia de preparar adecuadamente el perfil de
bsqueda, operacin que resulta as la ms importante en el proceso de recuperacin de informacin.

7
Introduccin a la Investigacin Biolgica
Curso 2009-2010
Jos Juan del Ramo Romero, Javier Nez de Murga, Manuel Nez de Murga, Jose Pertusa Grau
Preparacin de perfiles de bsqueda
El perfil de bsqueda parte de una peticin de informacin en lenguaje natural, y consta
esencialmente de tres elementos:
* Identificacin de los conceptos (1)
* Desarrollo y expansin de los conceptos, mediante una coleccin de trminos (2)
* Expresin de las relaciones entre los trminos, mediante operadores lgicos (AND, OR,
NOT) (3)
Vamos a referirnos a la elaboracin de un perfil para una bsqueda temtica )tambin es posible
realizar bsquedas por autores, revistas, idiomas, etc.). Tomemos un ejemplo sencillo:
** Peticin de informacin sobre pinturas anticorrosivas de alto contenido en cinc**
(1) En esta peticin identificamos como conceptos:
- pintura
- corrosin y su prevencin
- cinc
(2) La segunda fase, o expansin de conceptos, es imprescindible debido a que, para efectuar la
bsqueda, el ordenador compara los distintos trminos del perfil con los que contienen los modelos de
bsqueda de los documentos carcter a carcter y slo da como aciertos los que coinciden exactamente.
As, un documento sobre recubrimientos anticorrosivos a base de cinc no se registrara como acierto. Es,
pues, necesario desarrollar cada concepto teniendo en cuenta los sinnimos, palabras ms genricas, ms
especficas, etc., para lo cual ser apreciable la ayuda de un thesaurus (conjunto de trminos de una bases
de datos). En nuestro ejemplo, y sin ser muy exhaustivos, el desarrollo de los conceptos conducira al
siguiente cuadro:

A B C
Pintura Corrosin Cinc
Recubrimiento Anticorrosivos Zinc
Barniz Degradacin Zn
Laca Desgaste
Esmalte Incrustacin

Como se puede ver, no slo se tienen en cuenta palabras relacionadas sino tambin las diversas
formas ortogrficas. En este sentido, ocurre con frecuencia que, para agotar todas las posibilidades, es
preciso considerar palabras derivadas de la que se ha utilizado como trmino. Por ejemplo, si se ha elegido
como trmino polimerizacin ser frecuente que interesen tambin trminos como polmero,
polimerizado, copolimero, etc. Para tenerlos en cuenta se hace uso del truncado, artificio mediante el
cual el ordenador considerar aciertos a todos los trminos que contengan determinados fragmentos de
palabras, sean cualesquiera las letras que se hallen antes o despus de los mismos.
Existen tres tipos de truncado:
- De sufijo: polimer*, cubrira polimer-o, polimer-os, polimer-izado, polimer-izacin,
- De prefijo: *polimero, cubrira polmero, co-polimero, homo-polimero,
8
Introduccin a la Investigacin Biolgica
Curso 2009-2010
Jos Juan del Ramo Romero, Javier Nez de Murga, Manuel Nez de Murga, Jose Pertusa Grau
- De infijo: *polimer*, cubrira todas las posibilidades apuntadas.
De todas formas no se debe abusar del truncado porque puede conducir a la recuperacin de muchos
documentos irrelevantes.
(3) La tercera fase, relaciona los trminos y conceptos mediante los operadores lgicos.

A B A AND B

A OR B A NOT B

* El operador OR permite obtener un nuevo conjunto formado por los documentos que
contienen indistintamente el trmino A o el B (operacin de unin)
* El operador de interseccin, AND, permite obtener un conjunto formado por los
documentos que contienen simultneamente los trminos A y B.
* El operador de exclusin, NOT, permite formar conjuntos de documentos que contienen
el trmino A, pero no el B.
En general, se relacionarn con la lgica OR los trminos correspondientes a un mismo concepto; con
la lgica AND los conceptos que deben estar presentes simultneamente y con la lgica NOT, aquellos que
se desee excluir. En nuestro ejemplo, el perfil resultante sera:

(pintura OR recubrimiento OR barniz OR laca OR esmalte)


AND
(corrosin OR anticorrosivos OR degradacin OR desgaste OR incrustacin)
AND
(cinc OR zinc OR Zn)

Aqu no hemos utilizado el operador NOT. Si se desea, por ejemplo, recuperar informacin sobre
pinturas anticorrosivas, excepto las que contengan cinc, bastara sustituir, en el perfil anterior, el ltimo
operador AND por el operador NOT.

Una vez preparado el perfil de bsqueda, se efectuar la comparacin con los modelos de bsqueda
de los documentos, para obtener los que se ajustan al perfil. Finalmente habr que comprobar si los
documentos obtenidos satisfacen los requisitos del peticionario, es decir, la relevancia de dichos
documentos para la bsqueda solicitada. Muy a menudo, la informacin que en verdad se necesita no
coincide exactamente con lo que se pide. Ello se debe, normalmente, a que el usuario no conoce con
precisin sus necesidades, o no es capaz de expresarlas de forma adecuada.

9
Introduccin a la Investigacin Biolgica
Curso 2009-2010
Jos Juan del Ramo Romero, Javier Nez de Murga, Manuel Nez de Murga, Jose Pertusa Grau

You might also like