You are on page 1of 16

Instituto Superior de Lnguas e Administrao

Ps-graduao
Gesto de Bibliotecas Escolares
A distncia

Indexao
Trabalho 2

Dina Cordeiro
Fernanda Pico
Isabel Silva
Patrcia Marques
Vera Saraiva


Maro de 2014

Trabalho 1 Indexao 2
I As linguagens documentais
a) Defina linguagem documental. Descreva, por palavras suas, as caractersticas
que a distinguem da linguagem natural.
Se a Linguagem Natural est intrinsecamente ligada construo do pensamento e
necessidade de expresso, esta a linguagem usada para a comunicao verbal entre
suas pessoas. A linguagem documental aquela que procura descrever o contedo dos
documentos, de uma forma artificial, convencional e controlada, permitindo o arquivo
da informao e posterior recuperao da mesma, o que possibilita ultrapassar os riscos
de disperso, incoerncia e ambiguidade inerentes linguagem natural.
A linguagem documental possui trs caractersticas que a distingue da linguagem
natural: Artificial ou subordinada a regras prprias utilizadas em contexto especfico,
pois representa conceitos atravs do uso de smbolos alfabticos ou numricos;
Controlada, com o objetivo de evitar ambiguidades na representao de conceitos,
centrando-se, assim, num nico termo de indexao cujo significado seja claro/distinto e
no permita interpretaes diversas; Convencional, com vista partilha til e unvoca
de contedos bibliogrficos entre bibliotecas, sendo portanto convencional e tambm
normativa, pois faz uso de smbolos ou cdigos alfabticos, numricos ou
alfanumricos.

Figura 1 Linguagem documental versus Linguagem natural
Trabalho 1 Indexao 3
b1) As linguagens documentais so tipificadas de acordo com trs critrios,
segundo Gil Urdician. Quais so esses critrios?
So trs os critrios de tipificao das linguagens documentais, a saber: de controlo
sobre o vocabulrio; da coordenao dos termos; da estrutura, como se pode ver na
figura 2.

Figura 2 Linguagens documentais segundo Gil Urdician
b2) Que tipo de linguagens documentais conhece?
Os dois primeiros tipos de linguagens documentais que apareceram em finais do sculo
XIX designam-se de classificaes universais ou sistemas para organizao do
conhecimento, pois incluem um conjunto de esquemas que organizam, gerem e
recuperam a informao; so elas, a Classificao Decimal de Dewey e a Classificao
Decimal Universal. Estas duas classificaes so hierrquicas e preveem a organizao
sistemtica do conhecimento. No entanto, a classificao CDD marcadamente
enumerativa, enquanto que a CDU, marcadamente sinttica, tendo esta um maior
suporte a nvel das ferramentas da gesto documental (SLAVIC, 2000:7). Estas
classificaes, que seguem os princpios da pr-coordenao, podem ser tipificadas de
acordo com a figura 3.
Trabalho 1 Indexao 4

Figura 3 Linguagens documentais CDD e CDU
As linguagens vocabulares, terminolgicas ou combinatrias surgem, igualmente, nos
finais do sculo XIX, com a utilizao da primeira lista de cabealhos de assunto ou
lista de encabeamento de matrias e serviram de base concetual ao SIPORbase. Os
tesauros aparecem apenas em meados do sculo XX (anos 50) com uma linguagem que,
embora controlada, era mais prxima da linguagem natural e uma resposta adequada s
necessidades da exploso e informatizao documental.
b3) Como professor bibliotecrio com qual/quais as linguagens documentais que
trabalha?
A Professora Bibliotecria do nosso grupo utiliza a Classificao Decimal Universal,
que aquela com que ns, enquanto utilizadores da BE, tambm tomamos contacto.
c) Qual a fase do processo de indexao em que as linguagens documentais
intervm? Justifique a sua afirmao.
So trs as fases de indexao: Anlise e compreenso do texto e do seu contedo
informativo; Representao verbal do contedo informativo, identificao e seleo dos
conceitos; Traduo ou representao desses conceitos na linguagem documental.
As linguagens documentais intervm quando pretendemos pesquisar sobre um tema ou
um assunto e, assim, responder seguinte questo: Qual o assunto deste documento?
Deste modo, recorremos s linguagens documentais na terceira fase do processo de
indexao, ou seja, na traduo dos conceitos escolhidos em termos de linguagem
documental, como se pode observar, de forma esquemtica, na figura 4.
Trabalho 1 Indexao 5

Figura 4 Fases do processo de indexao
d) As linguagens documentais ou de indexao caraterizam-se pelo seu vocabulrio
controlado que pretende obviar um conjunto de situaes que geram ambiguidade
na comunicao. Identifique essas situaes e d alguns exemplos.
Sendo a linguagem de indexao um conjunto controlado de termos escolhidos numa
linguagem natural, segundo a NP 4036 (1992), por isso que surgem, com
frequncia, obstculos lingusticos prtica documental (aquando do uso controlado de
uma linguagem terminolgica).
Os obstculos lingusticos mais frequentes so diversos, a saber: Sinonmia; Polissemia;
Homonmia; Homografia; Homofonia; Singular e Plural; os quais se encontram
devidamente identificados no esquema abaixo.













Figura 5 Obstculos lingusticos frequentes prtica documental
Trabalho 1 Indexao 6
e) O controlo do vocabulrio deve ser estabelecido a dois nveis. Identifique-os e
justifique essa necessidade.
O controlo do vocabulrio documental tem como objetivo a elaborao de termos numa
linguagem controlada, por oposio linguagem natural. Este controlo faz-se em dois
nveis essenciais, a forma dos termos (nvel formal) e o seu significado (nvel
semntico). Esta normalizao pretende, atravs do controlo vocabular, contornar
ambiguidades inerentes linguagem natural, tais como as questes de sinonmia e
homonmia, dos singulares e plurais.
f) Defina relao semntica. Identifique e defina as que conheces.
As relaes semnticas devem ser controladas ou mostradas nas linguagens de
indexao, com o objetivo de se indicarem os termos alternativos de indexao e
pesquisa. Estas relaes podem ser de trs tipos: de equivalncia, hierrquicas e
associativas.
As relaes semnticas de equivalncia so assimtricas e irreversveis e tm como
objetivo o controlo da sinonmia. As relaes semnticas hierrquicas so recprocas e
assimtricas, pois estruturam-se segundo graus/nveis de superioridade ou de
subordinao, em trs tipos: relao genrica; relao partitiva ou todo/parte; relao de
instncia. As relaes semnticas associativas, que so recprocas e simtricas, dizem
respeito s relaes entre pares de termos mentalmente associados, mas que no
pertencem a um mesmo conjunto de equivalncia.

II OS TESAUROS
a) Defina tesauro.
So vrias as definies de tesauros, como, por exemplo: vocabulrio controlado de
termos com relaes semnticas abrangendo um ou vrios domnios particulares do
conhecimento (NP 4285-4, 2000, p.5) ou vocabulrio de uma linguagem de indexao
controlada, organizado formalmente de maneira a explicitar as relaes estabelecidas a
priori entre os conceitos (NP 4036, 1992, p.5).
Os tesauros so, portanto, listas de termos autorizados, em cada domnio particular do
conhecimento, relacionados entre si de forma logica e semntica. Os tesauros utilizam-
se na fase de caraterizao do contedo de um documento e na fase de resposta s
questes de busca dos utilizadores. Conclui-se que a funo dos tesauros a
intermediao entre documentos e os utilizadores. Assim, os tesauros so construdos
Trabalho 1 Indexao 7
segundo o princpio combinatrio, baseado na combinao de termos, utilizando os
operadores booleanos (AND; OR; NOT) quando se realiza a pesquisa.
O termo "thesauros", com origem no termo grego "thesaurs" que significa tesouro ou
repositrio, popularizou se com a publicao do dicionrio analgico de Peter Mark
Roget, em 1852, denominado de "Thesaurus of English words and phrases". A
designao de "thesaurus" prende-se com o facto de este tambm designar vocabulrio,
dicionrio ou lxico. Assim o thesaurus de Roget era um vocabulrio organizado
segundo o significado dos termos.
No entanto, desde Roget at aos nossos dias, o conceito e contedo de um tesauro
evoluiu, e segundo Currs (1995, citado por Moreira, Oliveira & Alvarega, 2004), trata-
se de uma linguagem especializada (do domnio das cincias da documentao),
normalizada ou controlada, ps-coordenada, pois os termos so combinados no
momento do seu uso. composta por termos lingusticos simples e
compostos relacionados entre si sinttica e semanticamente.
Os tesauros evoluram em duas frentes: A abordagem alfabtica (Unitermo) originria
da Amrica do Norte; A linha da classificao bibliogrfica (Teoria da Classificao
Facetada) da Europa. Mais recentemente, surge a linha dos tesauros-com-base-em-
conceitos, tambm denominado de tesauros terminolgicos.
b) Quais so as funes de um tesauro?
As funes de um tesauro so a normalizao do vocabulrio, induo e representao.
A normalizao do vocabulrio ou unificao do lxico num tesauro feita a partir da
construo das listas de termos autorizados, segundo cada rea particular do
conhecimento, relacionados entre si de forma lgica e semntica. A segunda funo a
induo, pois o tesauro permite identificar, de forma sistematizada, todas as alternativas
possveis de entradas, para uma eficaz recuperao de informao numa pesquisa. J a
funo de representao que o tesauros encerra, decorre da correspondncia entre os
descritores (termos de indexao de um tesauro) e os conceitos presentes nos
documentos, pois permite que o indexador identifique os termos representativos dos
assuntos de um documento e os traduza para termos permitidos do tesauro.
As funes de um tesauro encontram-se esquematizadas na figura abaixo apresentada.
Trabalho 1 Indexao 8


Figura 6 - Funes de um tesauro
c) Qual a composio de um tesauro?
Um tesauro constitudo por unidades lexicais (os descritores e os no-descritores ou
termos equivalentes) e relaes semnticas (de equivalncia, hierrquicas e
associativas).
Um Tesauro composto por unidades lexicais, identificadoras de uma unidade
concetual, cujas entradas so individuais e ordenadas de acordo com as suas relaes
recprocas, acrescidas de notas explicativas.
Para representar unidades conceituais num Tesauro usam-se descritores, no-descritores
(palavras ou termos empregados para remeter a um equivalente, utilizado em um
Tesauro), qualificadores (smbolo ou palavra diferenciadora de significados ou que
poder ajudar a precisar a utilizao do termos num determinado contexto) e
modificadores (adjetivo ou frase que se adiciona ao ncleo para expressar um conceito
diferente, precisando ou delimitando seu alcance).
Num Tesauro estabelecem-se relaes entre conceitos, definidas por: relaes de
equivalncia, relaes hierrquicas, relaes partitivas e relaes associativas. As
primeiras, relaes de equivalncia, criam-se quando um conceito expresso por dois
ou mais termos e se seleciona um deles como sendo o preferido. J as segundas
relaes, designadas de hierrquicas, surgem quando temos dois termos diferentes
Trabalho 1 Indexao 9
com caractersticas idnticas, em que um deles mais amplo ou extenso que o outro.
Finalmente, as relaes associativas surgem quando se unem dois termos, no
equivalentes nem hierrquicos, com conotaes diferentes mas proximidade de
significados no contexto do universo de referncia (Exemplo: Estudo/Investigao;
Estudo/escola; Estudo/Universidade).
d) O que entende por descritor?
A NP 4285-4 (2000:5) define descritor termo de um tesauro que pode ser utilizado
para representar um conceito de um documento ou de uma pesquisa bibliogrfica. Por
seu lado, a NP 4036 (1992:5) define tesauro como vocabulrio de uma linguagem de
indexao controlada, organizado formalmente de maneira a explicitar as relaes a
priori entre os conceitos (por exemplo, relao genrica e especfica).
Descritor o termo de indexao, ou conjunto e palavras, que representa de forma
unvoca uma unidade concetual e definido como preferencial (um nico). J os termos
no preferenciais, sinnimos dos termos definidos como descritores, designam-se de
no descritores.
e) Tipifique os descritores.
Os descritores podem ser tipificados quanto sua carga informativa, ao seu contedo e
composio. Em relao sua carga informativa, podem ser primrios (usa um nico
termo, apresentando o conceito de forma unvoca) e secundrios (usam termos
compostos para representar conceitos). Quanto ao seu contedo, estes podem ser
onomsticos (referem-se ao nome de uma pessoa individual ou coletiva), geogrficos
(representam conceitos de mbito geogrfico), materiais ou temticos (representam
entidades concretas e abstratas) e cronolgicos (associados a um espao de tempo.
Quanto composio, os descritores podem ser simples (recorrem a uma nica palavra)
e compostos (recorrem a um grupo de palavras - sintagmas - para designar os
conceitos).
f) Num tesauro os descritores podem ser apresentados de diferentes formas.
Identifique cada uma delas e exemplifique.
Um tesauros pode ser apresentado de forma alfabtica, sistemtica ou grfica.
Na apresentao alfabtica, todos os termos, descritores e no-descritores, esto
organizados numa sequncia alfabtica nica. Sendo que os no descritores so
acompanhados pela referncia USE que os remete para o descritor. As informaes de
Trabalho 1 Indexao 10
um descritor devem estar enunciadas segundo uma ordem: NE ou (SN); UP ou (UF);
TT; TG ou (BT); TE ou (NT); TR ou (RT).
No exemplo da figura abaixo, fizemos uma pesquisa, no tesauro FORMEI, por
Educao de adultos, e surgiram as informaes do descritor pela seguinte ordem: NE,
notas explicativas; UP, com a indicao e um no descritor, Formao de adultos, que
um termo relacionado com o da pesquisa, mas no preferencial e portanto no descritor;
No tem TC, pois tambm no obrigatrio; TG, com a indicao dos termos
genricos, Educao; TE, com a indicao dos termos especficos, mais precisamente
Educao da mulher, Educao dos trabalhadores, Educao informal e Educao no-
formal; TR, indicao dos termos relacionados que so neste exemplo, autoajuda,
educao permanente e formao profissional.

Figura 7 Apresentao alfabtica do termo Formao de adultos no tesauro
FORMEI
Relativamente apresentao sistemtica, um tesauro em que os termos estejam
organizados sistematicamente deve conter categorias ou hierarquias de termos, segundo
o seu significado, relaes lgicas e ndice alfabtico que direciona o utilizador para o
local apropriado da apresentao sistemtica. Com este tipo de apresentao, a parte
sistemtica muitas vezes considerada como a parte principal do tesauro, isto , a que
contm a maior quantidade de informao definidora e relacional. A organizao
primria de um tesauro sistemtico pode obedecer a diferentes formas de organizao:
Organizao em domnios ou disciplinas; Organizao em facetas; Combinao das
Trabalho 1 Indexao 11
duas anteriores. Exemplo de organizao em domnios: neste tipo de organizao,
comea-se por organizar o universo dos conhecimentos em classes principais e depois
em subclasses, como se pode ver no exemplo abaixo:
No Eurovoc, escolhemos Cincias e educao em portugus e, por exemplo, para o
descritor atividade escolar, temos o seguinte:

Figura 8 Apresentao sistemtica do termo Cincias e educao em portugus, no
tesauro Eurovoc
J numa organizao por facetas, os termos so organizados em classes ou conjuntos,
segundo as noes que representam, sem ter em conta o ou os domnios com o qual ou
os quais a noo habitualmente associada. aplicvel a qualquer rea do
conhecimento.
A combinao dos dois tipos de organizao pode ser feita de diversas formas, como,
por exemplo, a organizao primria definida por domnios e, em seguida, subdividido
segundo as facetas.
Na apresentao grfica, os termos de indexao e as suas relaes so dispostas numa
figura a duas dimenses, que permite ao indexador ou utilizador dispor de toda uma
gama de termos e suas relaes. Existem vrias formas de apresentao grfica, sendo
os dois tipos principais: Estrutura arborescente (NP 4036, 1992:43); Esquema em flecha
(NP 4036, 1992:45)
Um tesauro que inclua uma apresentao grfica deve comportar duas partes:
Apresentao grfica (limitada aos descritores); ndice alfabtico (contm as notas
explicativas e relaes de equivalncia, podendo tambm incluir as relaes
hierrquicas e associativas).
Trabalho 1 Indexao 12
A partir do descritor bebida, temos os seguintes no descritores e a apresentao grfica
dos termos de indexao, abaixo indicada na figura 9.
Bebida
Bebida hdrica
Bebida hdrica natural
gua potvel
gua mineral
Bebida hdrica artificial
Bebida estimulante
Bebida lctea








g) Realize uma pesquisa na Internet e identifique alguns tesauros disponveis.
Selecione e copie trs endereos de pginas Web que contenham tesauros. Escolha
um desses tesauros, explore-o, realize pesquisas e justifique a preferncia.
Tesauro SPINES
O Tesauro SPINES foi elaborado no mbito de um programa da Unesco (1972) e
destinava-se implantao de um sistema internacional de intercmbio de informaes
no campo da poltica cientfica e tecnolgica. A presente verso preliminar, em lngua
portuguesa, foi realizada a partir de um trabalho conjunto que envolveu diversas
instituies.
Links:
livroaberto.ibict.br/bitstream/1/999/5/Tesauro%20Spines.pdf
ou
Figura 9 Apresentao grfica do termo bebida num tesauro
Trabalho 1 Indexao 13
http://livroaberto.ibict.br/handle/1/999

Thesaurus Brasileiro da Educao
O Thesaurus Brasileiro da Educao (Brased) um vocabulrio controlado que rene
termos e conceitos, a partir de documentos analisados no Centro de Informao e
Biblioteca em Educao (Cibec), relacionados entre si a partir da estrutura concetual na
rea da educao.
Link
http://portal.inep.gov.br/pesquisa-thesaurus

Tesauro FORMEI
O Tesauro FORMEI visa uniformizar as prticas de indexao dos Centros de
Recursos em Conhecimento que integram a Base FORMEI, servindo, tambm, como
ponto de acesso dos utilizares aos documentos disponveis no catlogo.
Na base FORMEI encontram-se referncias bibliogrficas de monografias,
publicaes peridicas, documentos audiovisuais e em suporte eletrnico. Atualmente
integra as seguintes reas temticas: Formao, Emprego, Educao, Inovao, Higiene
e Segurana no Trabalho, Segurana Social e Gesto.
Link
http://www.crcvirtual.org/upload/imgs/TESAUROFinal..pdf
Escolhemos este tesauro porque, uma vez que estamos a tirar uma PG em Gesto de
Bibliotecas Escolares, este trata de indexao em Centros de Recursos e Conhecimento
e, como somos professoras/ formadoras, tem tudo a ver connosco.
A pesquisa atravs do tesauro surge como mais um ponto de acesso aos documentos, na
pgina inicial do mdulo de pesquisa atravs da Internet, atualmente disponvel em
http://opac.iefp.pt:8082/winlib/winlib.aspx?&pesq=6.

A formulao da pesquisa pode ser por palavra, por expresso, por cada palavra dentro
da expresso, por todas as palavras dentro da expresso. Para se ver as relaes do
termo pesquisado, deve ser selecionada, em formato, a opo termo. Doutra forma,
sero apresentados apenas os descritores que correspondem pesquisa por ordem
alfabtica. Para se aceder listagem dos registos indexados por esse termo, basta clicar
no smbolo colocado direita de cada descritor.
Exemplo de uma apresentao hierrquica a partir do termo educao:
Trabalho 1 Indexao 14















Em relao educao relacionada com o ambiente fsico, obtemos:















Figura 10 Apresentao hierrquica do termo educao no tesauro FORMEI
Figura 11 Descritores de educao relacionados com o ambiente fsico
Trabalho 1 Indexao 15
Para os termos relacionados com educao obtm-se os descritores da figura 12 abaixo.















Quando h dvidas quanto forma singular ou plural do termo que se pretende
pesquisar, basta usar o singular que o sistema apresenta tambm os descritores que
tenham uma forma plural, desde que este seja formado regularmente.

Figura 13 Singular remete para o plural
No caso de plurais irregulares, pode digitar-se apenas a parte do termo que comum,
substituindo o restante por um asterisco * (truncatura direita). O mesmo mtodo deve
Figura 12 Termos relacionados com educao
Trabalho 1 Indexao 16
ser utilizado quando se pretende pesquisar termos que tenham uma raiz comum.

Figura 14 Como pesquisar plurais irregulares
Uma das dvidas muito frequentes, quando se usam expresses de pesquisa, refere-se
aos elementos de ligao dos termos (preposies ou contraes de proposies com
pronomes). Nestes casos, deve usar-se tambm um asterisco em substituio desse
elemento. O sistema recuperar todas as ocorrncias independentemente da forma como
esto ligados.

Referncias Bibliogrficas
Moreira, A., Alvarenga, L., & Oliveira, A. d. (Dezembro de 2004). O nvel do
conhecimento e os instrumentos de representao: tesauros e ontologias. Obtido
em 28 de Maro de 2014, de DataGramaZero:
http://www.dgz.org.br/dez04/Art_01.htm
NP 3485 - 4. (2000). Documentao e informao Vocabulrio Parte 4: Linguagens
documentais. Lisboa: IPQ.
NP 4036 - 1992. (1992). Documentao: Tesauros monolingues: diretrizes para a sua
construo e desenvolvimento. Lisboa: IPQ.