You are on page 1of 7

INDEXAO DOCUMENTRIA: UMA FORMA DE REPRESENTAO DO CONHECIMENTO REGISTRADO1

Virgnia Bentes Pinto2

Resumo A indexao documentria uma das reas da Cincia da Informao que mais evoluiu nestes ltimos anos. Esta evoluo est estritamente ligada s mudanas de paradigmas que ocorrem na nossa sociedade, independente do domnio do conhecimento. Ela faz parte de um sistema global: o Sistema de Recuperao de Informao (SRI) o qual constitudo por um conjunto de atividades que contemplam desde o processo de seleo e aquisio at a recuperao da informao ou de documentos nas Unidades de Documentao3. A indexao tem por objetivo terico expressar de maneira o mais fiel possvel, a representao dos elementos que pertencem ao contedo de um documento - seja ele real ou virtual- a fim de que o mesmo possa ser recuperado posteriormente. Por se ocupar do tratamento da informao visando a representao mnima do contedo do documento, esta atividade possui uma forte carga cognitiva. Neste estudo apresentado o estado da arte da indexao documentria, os seus fundamentos tericos e a indexao manual. Palavras-chave: Indexao documentria; indexao manual; sociedade da informao. Abstract One domain of Information Science that has most developed in the last 30 years is the documentary indexing. This evolution is strictly linked to the changes of paradigms

that happen in our society, independent of the domain of the knowledge. This article is concerning the new changes of indexing and it is the first part of a sequence of two papers concerning indexing. Key words: Indexing documentary; indexing manual; society of the information.

1 INTRODUO
O desenvolvimento cientfico e tecnolgico favorece o aumento da produo do conhecimento, de um lado, e a sua fragmentao de outro, em funo do aparecimento de novos campos do saber. Essa fragmentao no implica em uma individualizao das cincias, muito menos da tecnologia, muito pelo contrrio, ambas buscam apoio intra e/ou entre elas e em outros domnios do conhecimento, a fim de serem melhor compreendidas nesse novo paradigma da sociedade dita da informao (Information Society), do conhecimento (Knowledge Society) ou do aprendizado (Learning Society). Neste contexto interdisciplinar, observamos que a produo do saber se apresenta formalmente estruturada sobre vrias formas, como por exemplo sobre a forma impressa (livros, peridicos, folhetos, patentes, relatrios tcnicos, normas tcnicas, etc.), sobre a forma de imagem (fotografias, desenhos, etc.), sobre a forma de multimdia (combina-

Artigo baseado no capitulo II da tese de doutorado La representatio des connaissances dans le contexte de la documentation tecnique: proposition dum modle dindexation. Doutora em Cincia d Informao e da Comunicao-Institut de Communication et des Mdias-Universit Stendhal Grenoble 3-Frana. Professra do Departamento de Comunicao Social e Biblioteconomia-UFC. Em todo o decorrer deste trabalho ns consideramos Unidades de Documentao como sinnimo de Bibliotecas, Centros de Documentao e outros do gnero.

Rev. de Letras - N0. 22 - Vol. 1/2 - jan/dez. 2000

63

o de textos, de imagens, de sons e outros dados). Alm destas, existem ainda os conhecimentos tcitos, os materializados nos prprios produtos, como o caso das mquinas e equipamentos, e tambm aqueles apresentados informalmente sobre a forma oral em feiras, exposies e outros do gnero, sem contar com o conhecimento tcito. Ora, se a forma de apresentao do conhecimento mudou, seu suporte de estocagem tambm mudou e, hoje, encontramos os conhecimentos registrados tanto em suportes tradicionais como o papel, quanto em suportes eletrnicos, pticos e magnticos. Esse aumento do conhecimento se traduz pela disponibilidade de uma quantidade enorme de informao, recurso que est sendo considerado como o capital mais importante de nossa sociedade, posto que ele representa um alto valor agregado para o setor produtivo industrial e empresarial. Ora, se nesta sociedade a informao tem um papel fundamental para o avano da cincia e da tecnologia, ela tem igualmente um lugar importante na vida cotidiana dos cidados, que precisam estar bem informados para que possam exercer dignamente a sua cidadania. Foi partir destas observaes que produzimos este artigo, tecendo comentrios, inicialmente, a respeito do acesso a informao na sociedade do conhecimento, em seguida trabalhamos a indexao em seu estado da arte e finalmente a indexao manual como forma de representao do conhecimento registrado visando a sua recuperao posterior.

1) uma sociedade grande produtora e consumidora de informaes, portanto a sua matria-prima a informao; 2) uma sociedade que, mesmo sendo produtora e consumidora de uma quantidade enorme de informaes, se depara com inmeras dificuldades para acessar esta avalanche de informaes que nos submerge quotidianamente; 3) uma sociedade produtora e utilizadora das ferramentas de tratamento, estocagem e recuperao da informao, propiciadas pelas Tecnologias da Informao e da Comunicao (TICs); 4) uma sociedade onde as TICs possibilitam, por um lado, alto alcance, predominam as lgicas das redes e a suposta flexibilidade. Por outro lado convivemos com a chamada infoexluso e com inmeras perdas; 5) uma sociedade na qual o ser humano necessita, ansiosamente, estar atualizado para poder acompanhar as transformaes que se processam, quotidianamente, em uma velocidade infrevel; Dentre estas variveis, as correspondente ao ser humano, so infinitamente atingida pelas outras, pois este sujeito vive submerso pelas informaes, necessita estar atualizado para no ficar a reboque das mudanas que se processam a todo momento e, se depara com as dificuldades para acessar tais informaes, mesmo com a existncia das ferramentas das NTICs. Essas barreiras de acesso a informao so explicadas por KURAMOTO (1999), quando afirma que para navegar sobre o espao do saber preciso conhecer este espao, saber utilizar as ferramentas das NTICs e igualmente conhecer as estratgias de busca e recuperao de informao, ou ainda ter a ajuda de um especialista neste domnio para que as necessidades de informao dos usurios possam ser atendidas de maneira eficaz e eficiente. Nesta perspectiva, torna-se imprescindvel que saibamos o que fazer com as NTICs e quais as conseqncias de sua m utilizao o que pode, certamente, comprometer tanto a tecnologia (produto/servio) quanto os que esto sendo seus usurios. Alm destas variveis, consideramos ainda; a ausncia e/ou deficincia no processo de indexao. Esse fato notrio, tanto quando buscamos informaes nas Unidades de Documentao, ou ainda sobre a rede Internet que, quase sempre nos fornece como respostas um calhamao de dados que muitas vezes no condizem com o que foi demandado. Por exemplo, um dia havia necessidade de uma informao sobre a minha conta no Banco do Brasil em Fortaleza. Estava na Frana e, o acesso podia ser feito pela Internet. Com a estratgia de busca Banco do Brasil & Fortaleza, procurei no Alta Vista e no Yahoo. Tive 193 respostas compostas pelas palavras banco, Brasil, Fortaleza e do, mas nenhuma resposta com Banco do Brasil. Problemas desta natureza so enfrentados por inmeros usu-

2 ACESSO INFORMAO NA SOCIEDADE DA INFORMAO


A enorme quantidade de informaes que hoje esto disponveis favorece a que se tenha a iluso de que:
jamais nous navons t mieux informs, ce qui ne veut pas dire que nous savons traiter et intgrer ces donnes qui litteralment nous soubmergent. Trop dinformation tue peut-tre linformation, suscite des vasions imaginaires, des refus de savoir, et se heurte de toute faon la clture informationnelle de chacun (un organisme nutilise quune infime partie des signaux qui traversent son envirtonement (BOUGNOUX, 1993, p.11).

Corroborando, Pierre LVY (1997, p.17), afirma que:


nous ne disposons que de trs peu dinstruments pour filtrer linformation pertinente, pour oprer des rapprochements selon des significations et des besoins toujours subjectifs, pour nous reprer dans le flux informationnel. (LVY, 1997, p.24)

Estas duas reflexes mostram claramente o paradoxo desta sociedade, a qual pode ser caracterizada, entre outras, como:

64

Rev. de Letras - N0. 22 - Vol. 1/2 - jan/dez. 2000

rios da rede e, certamente, pode ter sido decorrente de uma indexao baseada em unitermos, que considera cada palavra individualmente, e no os grupos sintagmticos, da, o fornecimento quase sempre de respostas insatisfatrias. Este exemplo mostra, explicitamente, a necessidade de se investir no tratamento tcnico dos recursos informacionais, assim como na sua organizao, de maneira mais conveniente, visando a racionalizao de sua estocagem e, naturalmente, a busca e a recuperao de informao de maneira eficaz e eficiente, porque como afirma CHAUMIER(1990 p.278), rien ne sert darchiver un document que lon ne saura pas trouve parce quil naura pas t index ou ainda porque ele foi indexado de maneira incorreta. Diante disto perguntamos, o que significa exatamente a atividade de indexao? Como ela deve ser efetuada? Quais so os problemas enfrentados para a sua execuo?

A primeira forma de indexar nos parece representativa dos descritores constitutivos dos documentos, ou seja do conjunto de suas unidades lexicais. Aqui desmontado o discurso do autor, onde as palavras tinham um sentido em funo do contexto ditado por seu criador, ou seja elas eram ligadas ao mundo real do documento. Retiradas do seu contexto tais palavras ou conceitos passam a significar apenas propriedades, portanto, seu sentido vai mudar, naturalmente. Ex. A gerao das tenses de alimentao, variveis em amplitude e Freqncia. Na indexao por palavras-chave/unitermos, teremos o conjunto seguinte: A, gerao, das, tenses, de, alimentao, variveis, em, amplitude, e, freqncia . Nesta maneira de indexar, as palavras so retiradas do contexto do logico-semntico onde elas tinham uma significao determinada por este contexto. Elevadas do mundo real, elas designam um conjunto de propriedades, seu sentido muda e se resume a um conjunto de unidades lexicais. Ora, segundo Michel LE GUERN (1991, p.23)
Le mot de la langue, contrairement ses occurrences dans le discours, na pas de rfrence extralinguistique. (...) La relation signe/objet, au sens de Peirce, correspond sommairement la relation saussurienne signifiant/signifi; les signifis font eux aussi partie de la structure de la langue. Pour que le descripteur remplisse sa fonction, qui est de mettre en relation un objet du monde-une entit extralinguistique-avec le document qui apportera des informations sur cet objet, il faut que le descripteur soit un signe indiciaire.(...) Les mots de la langue, en tant quils sont mots de la langue, ne signifient que des proprits, jamais des entits: ils signifient des attributs, et non des substances, tant quils ne sont pas mis en oeuvre dans le discours. Le descripteur, quant lui, signifie une entit, une substance au sens de la philosophie dAristote. Le descripteur ne peut donc pas tre considr, linstar des mots de la langue, comme un symbole sans rfrence.

3 INDEXAO: UMA FORMA DE REPRERSENTAO DO CONHECIMENTO


Para se trabalhar a indexao, inicialmente preciso considerar que este conceito utilizado em vrios domnios do conhecimento, por exemplo na economia, na demografia, no comrcio e nas cincias da Informao. Este ultimo o que nos interessa. Seguindo o raciocnio do professor Jean-Claude GARDIN ( 1974), consideramos a indexao documentria, como um conjunto de atividades que consiste em identificar, nos documentos, os seus Traos Descritivos (TDs) ou macroproposies e em seguida extrair os elementos/ descritores (sintagmas) indicadores do seu contedo visando sua recuperao posterior. Estes descritores vo se constituir na representao dos elementos indicadores do contedo do documento e no a sua representao, pois esta s pode ser pelo documento mesmo. A representao do conhecimento registrado, tendo em vista a indexao de documentos pode ser realizada tomando-se por base os conceitos /palavras-chave/unitermos ou ainda, em uma viso mais moderna, os sintagmas nominais (proposta apresentada pelo grupo SYDO), ou frases (proposta de Alain F. Smeaton e Paraic Sheridan), ou ainda os sintagmas verbais (proposta de Genevive Lallich e de Virginia Bentes Pinto). No caso dos conceitos palavras-chave, eles podem ser extrados4 do documento mesmo ou ainda atribudos partir de outras fontes, como por exemplo as Linguagens Documentrias (LDs)5. Em contrapartida, os sintagmas ou as frases s podem ser extrados do documento mesmo, portanto em uma lnguagem natural (LN).
4

Ao contrrio, se a indexao realizada tendo como base os sintagmas ou as frases, os ndices sero constitudos por passagens do texto portadoras de informao, neste caso podese ter uma representao mnima do contedo do documento medida que esses grupos no so isolados do contexto no qual eles so inseridos (onde eles tem um valor referencial). No exemplo apresentado anteriormente, se tomarmos como elementos representativos os sintagmas, iremos ter os seguintes:

O primeiro caso chamado por LANCASTER(1991) de indexao por extrao e o segundo indexao por atribuio. PAIJMANS (1993) os chama de assigned indexing e derivad indexing. No decorrer deste trabalho, consideramos as Linguagens Documentrias (LD), como um conjunto de termos estruturados utilizados como tradutores dos elementos indicarores do contedo dos documentos visando a construo de ndices para facilitar a recuperaa da informao.

Rev. de Letras - N0. 22 - Vol. 1/2 - jan/dez. 2000

65

Sintagama1= A gerao das tenses de alimentao, variveis em amplitude e freqncia Sintagma2 = as tenses de alimentao, variveis em amplitude e freqncia Sintagma3= as tenses de alimentao Sintagma4= a amplitude e freqncia Sintagma5= a freqncia Sintagma6= a amplitude Neste caso, podemos ter uma representao mnima do contedo veiculado no documento pois as suas unidades gramaticais no so retiradas de seu contexto, onde eles tinham um valor referencial. Alm do mais, preciso levar em considerao as caractersticas destes sintagmas, pois eles podero ser portadores seja de um conjunto de informaes, seja de um simples fragmento. A representao em nvel de indexao documentaria perpassa, ao menos, por trs etapas: a) anlise conceptual b) traduo c) controle de qualidade Quanto maneira de indexar, ela pode ser feita atravs de: 1) uma anlise manual, chamada igualmente intelectual, que feita pelos humanos; 2) uma anlise mecnica, feita pelas ferramentas da informtica; 3) uma anlise que combina as duas: humana e mecnica. Esta ultima chamada indexao semi-automtica ou assistida pelo computador, sendo realizada da seguinte maneira: inicialmente o sistema faz uma indexao automtica dos documentos levando em conta as ocorrncias das palavras mais freqentes no texto. Em um segundo momento, o indexador humano refina a lista dos descritores propostos pelo sistema fazendo os ajustes e/ou complementaes necessrias. Com relao dimenso da indexao, ela foi proposta pelo professor F.W. LANCASTER (1979), e trata-se da extenso com a qual um documento pode ser indexado, ou seja a exaustividade (exhausrivity), e a especificidade (specificity). A indexao exaustiva procura extrair do documento, o maior nmero de conceitos de forma cobrir o

seu contedo da maneira mais completa possvel. certo que esta maneira de indexar oferece a oportunidade de acesso a um grande nmero de conceitos, mas ao mesmo tempo ela pode ser responsvel pelo rudo6 durante a recuperao da informao. Segundo SOERGEL(1994), a exaustividade pode ser vista de dois aspectos: a exaustividade de pontos de vista e a exaustividade de importncia. A primeira, assegura que as facetas ou os pontos de vista considerados teis para a representao proposta pelas LDs sero disponveis para a recuperao da informao. A segunda, determina o nvel de importncia dos descritores propostos pelas regras de indexao. Outro fator observado nesta maneira de indexar diz respeito ao seu custo-eficcia, pois quanto mais exaustiva a indexao, naturalmente, maior ser o seu custo. Portanto, uma deciso neste sentido deve ser fundamentalmente justificada pelo conhecimento do perfil dos usurios e pelos objetivos da instituio (LANCASTER, 1991). A indexao especifica, como o nome o diz, leva em considerao os conceitos especficos em funo dos temas tratados no documento. Esta maneira de indexar diz respeito a profundidade com a qual o contedo de um documento tratado. Se de uma parte ela favorece a preciso, de outra, ela contribui para aumentar o silncio7 na recuperao da informao, pois levado em considerao apenas o contedo principal do documento, deixando de fora outros assuntos tratados, mesmo que de maneira no elementar. Um outro aspecto que deve se levar em conta na atividade de indexao refere-se definio das Unidades de Informao8 que podero entrar na construo do ndice. A indexao uma atividade que desmonta o discurso montado pelo autor do documento, medida que ela faz recortes neste discurso. Assim, ela permite passar de um documento constitudo (um documento primrio) sua reconstituio em um novo documento- ndice (um documento secundrio), o qual formado no pela representao do contedo do documento inicial, mas pela representao dos elementos indicadores do seu contedo e que vo se constituir na chave de acesso a recuperao da informao. A maneira de indexar depende, naturalmente, do tipo de documento indexar. Se tomarmos como exemplo uma monografia, como devemos indexa-la? Analisando o contedo predominante no documento, ou de maneira mais fina levando em conta por exemplo os captulos, os pargrafos e as sees? No que concerne aos peridicos e aos anais de eventos, a indexao deve se apoiar sobre os artigos, sobre as conferncias e comunicaes ou a partir de seus ttulos?

Consideramos como barulho, o excesso de documentos propostos pelos organismos de documentao para responder a uma demanda mas na realidade no respondem ao assunto demandado. Ele medido pela relao entre o nmero de documentos no pertinentes relacionados e nmero total de documentos propostos: B=dn/d, onde dn=documentos no pertinentes, d=documentos da base Neste trabalho, o silncio corresponde a ausncia de documentos que responderiam as necessidades dos usurios, mas na realidade no foram encontrados, mesmo que faam parte da coleo. A taxa de silncio corresponde a relao entre o numero de documentos pertinentes encontrados e o nmero total de documentos da base= Sl=dp/d, onde dp=documentos pertinentes, d=documentos da base Consideramos como Unidades de Informao, os fragmentos de textos reconhecidos como unidades de indexao

66

Rev. de Letras - N0. 22 - Vol. 1/2 - jan/dez. 2000

Tratando-se da indexao de documentos tcnicos - manuais tcnicos, patentes, normas tcnicas, bulas de medicamentos, laudos mdicos etc., a indexao deve ser conduzida levando-se em conta os ttulos, os captulos, as passagens.....? Os estudos e experincias, mostram que ainda no temos uma resposta precisa a estas interrogaes. No entanto, o que se observa que a indexao de monografias, de peridicos e de anais de eventos pode ser realizada tanto de maneira especfica - levando-se em conta a estrutura lgica das monografias, dos artigos de peridicos e das comunicaes de eventos- quanto de maneira bem geral, tomando-se como referncia os ttulos. Com relao a indexao de documentos tcnicos, ela deve ser conduzida no sentido da especificidade, pois os usurios deste tipo de documentos demandam uma informao pontual para responder s suas necessidades que so bem especficas. Assim, talvez a soluo seja indexar estes documentos levando-se em conta as suas estruturas lgicas pois, normalmente, elas refletem com mais clareza o contedo tratado no documento. Neste contexto a indexao pode ser realizada partir dos captulos, sees, pargrafos, passagens, etc. Estas consideraes mostram que no existe uma regra nica para a execuo da atividade de indexao, a maneira segundo a qual um documento vai ser indexado deve ser estabelecida nas polticas de indexao definidas pelas Unidades de Documentao. Estas polticas devem ser definidas em funo dos objetivos e da misso destes organismos, em funo do perfil de seus clientes potenciais, e deve estar contida em um manual, de maneira que os indexadores possam tomar conhecimentos das regras estabelecidas e possam segui-las. Esta deciso poder contribuir para reduzir de certa forma a subjetividade suscitada por esta atividade. Em que concerne a indexao de documentos audiovisuais, cujas caractersticas so o contedo (informao), a mdia vetor deste contedo e o suporte de estocagem. Isto nos traz problemas, pois neste caso a indexao demanda muito mais detalhes e muito mais informaes do gnero: Quem? O qu? Como? Onde, Quando.... ? A maneira de indexar estes tipos de documentos coloca em jogo alm das informaes visuais, outros tipos de informaes percebidas por outros rgos sensoriais desde que o sujeito conhea o contedo (CHELLAPPA, 1995). Segundo a professora Johanna SMIT (1989) as dificuldades para a indexao de documentos audiovisuais resulta da tentativa de passagem da denotao (o que o documento mostra) para a conotao (o que percebido pelo indexador). Ento, como deve ser feita a indexao destes documentos? Levando-se em conta os objetos representados e suas formas? A percepo visual ( cor) A cena? O acontecimento?

4 INDEXAO MANUAL
A indexao manual, chamada igualmente intelectual ou humana, como o prprio nome o diz, realizada pelos

humanos, sejam eles bibliotecrios ou especialistas do (s) domnio (s) no qual (is) as bases de dados so consagradas. Este tipo de indexao se baseia, sobretudo, no julgamento, normalmente intuitivo, dos indexadores, em funo do texto e do interesse para a sua comunidade de usurios. Para realizar essa indexao, preciso, inicialmente, analisar o contedo do documento, lendo-o no do inicio ao fim, mas por partes, ou seja lendo suas estruturas lgicas. Por exemplo, a introduo, os captulos, as sees, os pargrafos, a concluso e outras passagens consideradas importantes. Esta anlise pode ser estabelecida partindo-se das estruturas fornecidas pelos autores ou pelos editores de documentos ou ainda por uma segmentao proposta pelo indexador. Em resumo, ela comporta a leitura de documentos a compreenso de seu contedo, a identificao e a seleo de conceitos para representar os elementos indicativos deste contedo. Segundo FIDEL (1994), se faz necessrio considerar neste contexto dois aspectos: o documento propriamente, ou seja o seu lado objetivo e a razo ou motivo pelo qual o documento poder ser utilizado neste caso, os aspectos subjetivos. Aqui a indexao manual enfrenta um grande problema: a dificuldade de escolher os conceitos que podem melhor representar os elementos indicadores do contedo do documento e, a subjetividade desta escolha, o que pode explicar os desacordos freqentes entre os indexadores humanos. Aps esta anlise, passa-se a uma segunda etapa, a chamada traduo na qual os indexadores fazem uma comparao entre os conceitos pr selecionados em lnguagem natural com os descritores das LDs. Se esses conceitos coincidirem com os das LDs, eles podero ser escolhidos como representantes dos elementos que fazem parte do contedo do documento. Na prtica ns sabemos que, se os conceitos selecionados no coincidirem com os descritores das LDs, mesmo assim os indexadores podero os escolher. Esta deciso vai depender de seu conhecimento sobre o assunto, do seu conhecimento sobre o perfil dos usurios, da poltica de indexao adotada e, igualmente de sua experincia no domnio da indexao. A traduo uma etapa bem complexa, medida que ela exige o seguimento de regras que foram definidas priori, como por exemplo, os tesauros, as listas de autoridades, etc. Essas regras so consideradas como uma faca de dois gumes, pois se de um lado, elas parecem assegurar a qualidade da indexao, no que diz respeito desambiguisao das palavras, a organizao e normalizao dos ndice. De outro, elas podem ser responsveis pelo silncio ou pelo rudo no momento da recuperao da informao. Assim, segundo FIDEL (1994), as experincias dos indexadores tem mostrado que quando da etapa de traduo, necessrio levar em considerao alguns questionamentos, entre os quais ela cita: 1) as fontes dos termos de indexao: em quais fontes de vocabulrios de indexao os indexadores podem se apoi-

Rev. de Letras - N0. 22 - Vol. 1/2 - jan/dez. 2000

67

ar para escolher os termos que vo compor os ndices ? Existem regras que limitam o indexador aos descritores dos tesauros utilizados pelo sistema, e outras permitem que sejam utilizados os termos da lngua natural; 2) a preciso: que grau de preciso o indexador pode utilizar para traduzir os conceitos em termos de indexao? Os termos selecionados para o ndice devem ser to precisos que substituam o conceito ou eles devem ter um sentido mais geral ? Ex.: Fruticultura tropical no semi-rido: manga e caju Este documento deve ser indexado por: Frutas ctricas? Manga? Caju? 3) o peso: o peso relativo dos conceitos de um documento pode ser definido pelo indexador ? No exemplo anterior, qual conceito ter o peso maior? 4) a fidelidade: em que medida a traduo deve ser fiel ? Como ser fiel em uma traduo quando o conceito no tem um descritor correspondente? O indexador poder usar os termos aproximados ? Ex.: Cincia Cientfico 5) a linguagem do usurio: o indexador pode designar os termos de um ndice em uma linguagem mais prxima da do usurio ? Por exemplo, atravs dos seus perfis possvel estabelecer regras que podero lhes guiar na escolha dos termos de indexao mais adequados aos seus ? Ex.: Dor de cabeaCefalia Estas interrogaes so de fundamental importncia quando do estabelecimento das polticas de indexao que sero adotadas pelas unidades de documentao. As solues as questes 1, 2 e 5 so mais fceis de ser resolvidas, porque elas so ligadas tomada de deciso operacional. Ao contrrio, as solues s questes 3 e 4 no so fceis a resolver pois a definio do peso dos conceitos pertencentes a um documento implica em um processo subjetivo, portanto difcil a se colocar em prtica. Com relao fidelidade da traduo dos conceitos que no possuem descritores equivalentes, talvez a soluo seja conservar os conceitos, pois os descritores considerados prximos certamente que no possuem o mesmo sentido. Alm destes entraves, a indexao manual apresenta outras barreiras, entre as quais destacamos: custo elevado; pois ela exige pessoal especializado e demanda muito tempo. Segundo BERTRAND (1994), o tempo mdio de indexao de um documento de aproximadamente 30 minutos, podendo variar de 10 45 minutos, segundo as dificuldades encontradas com relao compreenso do contedo do documento ; fraca coerncia intra e entre os indexadores; a coerncia na identificao dos conceitos e na escolha dos termos de indexao, pelo mesmo indexador em

momentos diferentes de indexao, ou por outros indexadores eqivale a aproximadamente 30% (CLEVELAND, 1977); a dificuldade para escolher uma grande quantidade de conceitos, normalmente, no processo de indexao manual a escolha dos conceitos no ultrapassa de 05 (cinco). Assim, muitos assuntos tratados em um documento podero no ser percebidos pelos indexadores, o que vai provocar um aumento do silncio no momento da Recuperao da Informao. Na indexao manual, observamos que, se de um lado, o indexador tem um grande poder de deciso na definio dos conceitos que representaro os elementos indicadores do contedo do documento, de outro lado, encontramos vrios inconvenientes os quais causam problemas que so difceis a administrar por que: nem sempre o indexador especialista no domnio do(s) que ele indexa; nem sempre o indexador especialista no domnio da indexao ; existem novos domnios do conhecimento pouco cobertos ou ainda no cobertos pelas LDs especializadas; as inovaes terminologias que se verificam em vrios domnios do conhecimento exigem uma constante atualizao tanto por parte das LDs, como pelos indexadores. Contedo, o que se verifica que na realidade, nem sempre os indexadores so treinados e/ou reciclados neste sentido, e muito menos as LDs so atualizadas. Embora a atividade de indexao manual parea objetiva e neutra, na realidade isto no verdade, pois esta atividade consiste em um trabalho de anlise e sntese e, portanto, tem uma forte carga cognitiva, medida que ela demanda uma compreenso do contedo do documento, a extrao dos elementos correspondentes a este contedo, a representao destes elementos e a sua organizao em forma de ndices. Sendo naturalmente uma atividade subjetiva, ela influenciada pelos conhecimentos sobre o domnio do documento, pelas experincias do indexador, pelo conhecimento da atividade de indexao, pelo meio ambiente onde se realiza a indexao, entre outros. Assim ela no poder ser desprovida da neutralidade, mesmo que seja desejvel. Outra observao no que diz respeito a indexao manual, que, apesar da evoluo da indexao semi-automtica e automtica, elas no excluram esta prtica. Assim, mesmo considerada como obsoleta para uns, a indexao manual ainda utilizada tanto nos pases do chamado primeiro mundo como nos do terceiro. Ora, se este tipo de indexao ainda utilizada nos pases grande produtores e consumidores de recursos informticos , principalmente, por dois motivos: porque a indexao semi-automtica e automtica no oferecem respostas totalmente satisfatrias no momento da recuperao da informao;

68

Rev. de Letras - N0. 22 - Vol. 1/2 - jan/dez. 2000

porque os sistemas de indexao automtica ainda no atingem 100 % das unidades de documentao desses pases.

5 CONCLUSES
Nossa problemtica, neste trabalho, foi apresentar o estado da arte da indexao, mostrando o seu conceito, assim como a sua prtica. Ns observamos que graas interdisciplinaridade da cincia da informao, notadamente, com a informtica, a estatstica, a lingstica, e a psicologia cognitiva, o campo da indexao vem evoluindo bastante. Essa evoluo bem conhecida atravs da literatura quando observamos que inicialmente, as experincias foram calcadas em uma prtica manual simples e de forma intuitiva, cujo o objetivo era fornecer um conjunto de palavras que fossem capazes de oferecer algumas pistas para o usurio encontrar o documento que ele tinha necessidade. Salientamos ainda, que a indexao coloca em cena trs atores: o autor do documento, o indexador e o usurio. Consequentemente, para cada um a noo de pertinncia informacional ser percebida diferentemente segundo as suas experincias, os interesses de cada um no momento da produo ou de leitura do texto. Assim a cobertura dos conceitos escolhidos para representar os elementos do contedo do documento, no podem certamente chegar a 100%. Pois esta indexao nem sempre feita de maneira exaustiva, portanto, certas partes do documento no so levadas em considerao. Assim, ela vai provocar a perda de certas informaes, o que contribui para aumentar o silencio. No que concerne ao indexador e ao usurio, desejvel que a taxa de cobertura dos termos seja tima pois isto vai influenciar a pertinncia das respostas fornecidas no momento da recuperao da informao. Assim, qualquer que seja o mtodo de indexao utilizado, manual, semi-automtico e automtico, a indexao, atravs dos componentes do ndice, dever permitir aos clientes o acesso ao documento que contm a informao que ele necessita. Seu resultado se constituir em um dispositivo chave entre o documento primrio a ser lido e compreendido e um documento secundrio (ndice) a ser constitudo, de maneira tal que a representao dos elementos indicadores do contedo do primeiro sejam encontrados no segundo documento de maneira mais completa e fiel possvel. Pois este documento ndice que, durante a busca de informao, vai oferecer pistas para que o usurio possa decidir, sem ver o documento primrio, se ele vai considera-lo ou no, como possvel para responder sua necessidade. Portanto, a atividade de indexao visando a representao dos elementos do contedo de documentos calcada em dois objetivos fundamentais:

um terico: estabelecer os mecanismos para a elaborao dos ndices ; outro operacional: possibilitar a busca e a recuperao da informao. Para finalizar, lembramos que a indexao documentria uma atividade que pode ser aplicada aos documentos textuais, visuais, sonoros, pictricos, multimdia, etc.

6 REFERNCIAS BILBIGRFICAS
1. BENTES PINTO, V. (1999) La representation des connaissances dans le contexte de la documentation technique: proposition dun modle dindexation. Grenoble, (Thse de doctorat, Universit Stendhal Grenoble-3). 2. BERTRAND, A. (1993) Comprehension et categorisation dans une activit complexe: indexation de documents scientifiques . Toulouse, (Thse de doctorat, Universit de Toulouse). 3. BOUGNOUX, D. (1993) Sciences de linformation et de la communication. Paris, Larousse, . 4. CHAUMIER, J. (1990) Lindexation documentaire; de lanalyse conceptuelle humaine lanalyse automatique morphosyntaxique. Documentalist e, vol.27, n.6., p.275-284, nov.dec. 5. CHELLAPPA, R. (1995) Human and machine recognition of faces: a survey. Proc. of. the IEEE, v.83, n. 5, may. 6. FIDEL, R.. (1994) User-centered indexing. JASIS, v.45, n.8, p.572-576. 7. GARDIN, J. C. (1974) Les analyses des discours . Neuchatel, Delachaux et Nestl. 8. KURAMOTO, H. (1999) Proposition dun systme de recherche dinformation assist par ordinateur, avec application la langue portugaise . Lyon. (Thse de Doctorat lUniversit Lumire). 8. LALLICH BOIDIN, G. (1986) Analyse syntaxique automatique du fraais application lindexation automatique. Grenoble. (Thse de doctorat Universit des Sciences Sociales de Grenoble). 9.LANCASTER, F. W. (1991) Indexing and abstracting in theory and practice.London, Library Association. 10. _____. (1979) Information retrieval system characteristies, testing end evolution . New York, John Wiley, 381p. cap.1, p.1-14. 11. LE GUERN, M. (1991) Un alalyseur morpho-syntaxique pour lindexation automatique. Le franais moderne. v.59, n.1, p.22-35. 12. LEVY, P. (1997) Lintelligence collective: pour une anthropologie du cyperspace. Paris, Dcouverte/ Poche, p.21-24. 13. SOERGEL, D. (1994) Indexing and retrieval performance: the logiciel evidence. JASIS, v.45, n.8, p.589-599.

Rev. de Letras - N0. 22 - Vol. 1/2 - jan/dez. 2000

69

You might also like