You are on page 1of 11

William Guedes*

Rogrio Henrique de Arajo Jnior**


RESUMO

Trata do estudo, no mbito da cincia da informao, da teoria


matemtica da comunicao proposta por Claude Shannon
em 1948 e as suas similaridades com o ciclo documentrio no
que tange s etapas que vo desde a seleo, armazenamento
e tratamento tcnico de documentos, at a recuperao da
informao pelos usurios. O tema introduzido apresentando
quatro vertentes dentre as inmeras abordagens dos sistemas
de comunicao na cincia da informao, representadas pela:
1. comunicao cientfica; 2. dicotomia entre linguagens natural e
documentria; 3. insero da teoria matemtica da comunicao
na cincia da informao e 4. ciclo documentrio, que tem na
recuperao da informao a etapa mais significativa sob o ponto
de vista de um sistema de comunicao. Apresenta a definio, o
escopo e as caractersticas da teoria matemtica da comunicao,
reforando o seu carter pioneiro ao propor, sob bases slidas, o
clculo da quantidade de informao que pode transitar por um
canal de comunicao. Aborda tambm questes relacionadas
com neutralidade do canal de comunicao que esto presentes
em discusses na cincia da informao, tomando como exemplo
a valorao do documento segundo a teoria arquivstica.
Finalmente, so delimitadas as similaridades da teoria matemtica
da comunicao com o ciclo documentrio, onde um documento
pode ser visto tambm como um canal de comunicao, assim
como qualquer suporte que apresente informao a ser tratada
sob o ponto de vista documentrio.

Palavras-chave: Cincia da informao. Teoria matemtica da comunicao.


Ciclo documentrio. Sistemas de comunicao.

1 INTRODUO

s sistemas de comunicao tm sido


estudados
por
pesquisadores
de
diferentes reas de conhecimento, a
exemplo de cincia da informao e engenharia.
Na cincia da informao destacamos quatro
vertentes de abordagem para os sistemas de
comunicao.
A primeira aponta para a comunicao
de pesquisas desenvolvidas, onde o seu estudo
parte integrante do desenvolvimento da

memrica cientfica original

ESTUDO DAS SIMILARIDADES


ENTRE A TEORIA MATEMTICA
DA COMUNICAO E O CICLO
DOCUMENTRIO

* Mestre em Cincias da Informao


pela Universidade de Braslia, Brasil.
Analista de Finanas e Controle da
Controladoria-Geral da Unio, Brasil.
E-mail: wguedes@outlook.com.
** Doutor em Cincias da Informao
pela Universidade de Braslia, Brasil.
Professor da Faculdade de Cincia da
Informao da Universidade de Braslia,
Brasil.
E-mail: araujojr@unb.br.

cincia. Segundo Perucchi e Arajo Junior


(2011) a legitimao do conhecimento se d
pela divulgao, verificao e comprovao da
produo de conhecimento, processo que s
possvel por meio dos sistemas de comunicao
cientfica, que por sua vez encerram indicadores
importantes para a medida da atividade de
pesquisa, ou seja, a contabilizao do nmero
de artigos e trabalhos cientficos publicados e o
impacto dessas publicaes entre os pares.
A segunda vertente pode ser cotejada
na diferena entre linguagem natural e

Inf. & Soc.:Est., Joo Pessoa, v.24, n.2, p. xx-xx, maio/ago. 2014

71

William Guedes e Rogrio Henrique de Arajo Jnior


documentria. A linguagem natural pode
ser conceituada como a prpria comunicao
humana com a utilizao da palavra como forma
de expresso e comunicao entre indivduos
(emissor e receptor). De outra maneira, a
forma de interao humana realizada atravs
do uso de signos, dada por meio da expresso
escrita ou oral. J a linguagem documentria,
no mbito da cincia da informao, aquela
que objetiva traduzir semanticamente o
contedo dos documentos em uma linguagem
mais especializada, criada, exclusivamente,
para apoiar o processo de busca e recuperao
da informao, por meio da representao do
contedo dos documentos.
A terceira vertente de abordagem
trata da adaptao da teoria matemtica da
comunicao, que representa uma das inmeras
contribuies recolhidas pela Cincia da
Informao para delimitar o seu principal objeto
de pesquisa, o fenmeno da informao. A teoria
matemtica da comunicao se encaixa, segundo
texto clssico de Wersig e Neveling (1975), na
abordagem da mensagem onde a informao
frequentemente usada como sinnimo de
mensagem, pois o seu contedo medido pela
quantidade de informao que pode percorrer
um canal de comunicao. Desse modo, a
efetividade da comunicao vai ser dada pela
relao entre o resultado esperado pelo emissor e
o que ocorre no receptor.
A quarta vertente de abordagem
dos sistemas de comunicao representada
pelo ciclo documentrio que est configurado
como um processo composto de operaes
que vo desde a seleo, tratamento tcnico
(representao do contedo dos documentos
apoiada pela utilizao das linguagens
documentrias), armazenamento em sistema de
informao, passando pela criao de produtos
do processamento dos documentos, at a
recuperao da informao pelos usurios, que
a etapa mais significativa sob o ponto de vista de
um sistema de comunicao.
Assim sendo, o objetivo deste artigo
mostrar que existem similaridades claras entre as
abordagens das vertentes da teoria matemtica
da comunicao e do ciclo documentrio. Em
ambos os casos a problemtica que associa a
escolha, organizao, codificao e transmisso
da mensagem, questes centrais da teoria
matemtica da comunicao, tambm esto
72

presentes na considerao das etapas do ciclo


documentrio, notadamente no que se refere ao
armazenamento, indexao e recuperao da
informao.

2 TEORIA
MATEMTICA
COMUNICAO

DA

Publicado em 1948, um trabalho do


engenheiro e matemtico norte-americano
Claude Shannon teve especial importncia.
Pela primeira vez algum conseguira calcular
a quantidade de informao que poderia
transitar por um canal de comunicao. Isso foi
possvel a partir anlise estatstica da frequncia
de ocorrncia de letras nas palavras de um
idioma. Shannon estudou a distribuio das
letras na formao de mensagens escritas no
idioma ingls. Segundo as regras ortogrficas,
a probabilidade de umas letras ocorrerem em
sequncia a outras no igual em todos os casos.
A letra E ocorre mais frequentemente do que
o Q, e a sequncia TH mais frequentemente do
que XP, etc. Shannon, (1948, p. 5). Ele concluiu
que aproximadamente metade do que se escreve
em ingls determinado pela estrutura da
linguagem, sendo apenas a outra metade de
livre escolha do redator. Ou seja, metade do que
se escreve redundncia imposta pela estrutura
do idioma (neste caso, o ingls). Na lngua
portuguesa, a redundncia deve ser ainda maior,
segundo Fidalgo (2004):
De facto, as partes redundantes da
mensagem constituem algo que no
traz novidade e, portanto, sero
desnecessrias nesse sentido. A no
necessidade da citada redundncia
do artigo definido em portugus em
gnero e nmero torna-se clara quando
comparado com o artigo definido ingls
the que no conhece nem gnero
nem nmero. Tendo isto em conta, e
ainda, sobretudo, a personalizao das
formas verbais que existem na lngua
portuguesa em muito maior grau que
na lngua inglesa (s seis formas pessoais
dos verbos portugueses de eu amo
a eles amam correspondem no geral
apenas duas nos verbos ingleses I, you,
we, they love, he loves), quase certo
que a percentagem de redundncia
em portugus superior aos 50% de
redundncia que Shannon e Weaver
atribuem lngua inglesa, em que apenas

Inf. & Soc.:Est., Joo Pessoa, v.24, n.2, p. 71-81, maio/ago. 2014

Estudo das similaridades entre a teoria matemtica da comunicao e o ciclo documentrio


metade das letras ou das palavras que
escrevemos ou dizemos so de livre
escolha de quem fala, e que a outra
metade ditada pela estrutura estatstica
da lngua. (FIDALGO, 2004, p.5, grifo do
autor).

Essa abordagem, essencialmente tcnica,


no considera o significado das palavras, nem do
texto que elas formam.
O
problema
fundamental
da
comunicao o de reproduzir
em um ponto, ou exatamente ou
aproximadamente, uma mensagem
selecionada
em
outro
ponto.
Frequentemente as mensagens tm
significado, isto , elas se referem a
ou so correlacionadas de acordo
com algum sistema com certas
entidades fsicas ou conceituais. Estes
aspectos semnticos da comunicao
so irrelevantes para o problema de
engenharia. (SHANNON, 1948, p.
1).

A redundncia significa desperdcio do


canal de comunicao, porque o acrscimo
do nmero de palavras em decorrncia das
regras do idioma no implica mais informao
transmitida. Mas ela no deve ser totalmente
eliminada, porque contribui para a reduo do
rudo na comunicao.
O sistema genrico de comunicao
estudado por Shannon est representado na
Figura 1.
Figura 1 Diagrama de um sistema geral de
comunicao

Fonte: Shannon (1948)

Ele contm cinco partes:


Uma fonte de informao: produz a
mensagem (ou sequncia de mensagens)
que ser comunicada ao receptor. A
mensagem pode ser de vrios tipos: uma
sequncia de letras, como em um sistema
telegrfico; um sinal de rdio ou de uma
ligao telefnica; um sinal de televiso.
Um transmissor: o elemento que opera a
mensagem de modo a produzir um sinal
que seja adequado para ser transmitido
pelo canal.
O canal: o meio usado para transmitir o
sinal do transmissor ao receptor.
O receptor: realiza a operao inversa do
transmissor, reconstruindo a mensagem a
partir do sinal recebido.
O destinatrio: a pessoa (ou mquina)
qual a mensagem se destina (SHANNON,
1948).

A irrelevncia dos aspectos semnticos


da comunicao para a engenharia tem uma
razo muito simples: um canal de comunicao
deve ser neutro, permitindo o trnsito de
qualquer mensagem, independentemente de seu
significado.
Essa
neutralidade
do
canal
de
comunicao est tambm presente em
discusses na cincia da informao. Duranti
(1993) faz uma retrospectiva histrica da
valorao de um documento segundo a
teoria arquivstica, e relata como o conceito
de avaliao foi acompanhado das ideias de
imparcialidade, objetividade e profissionalismo
na literatura da Alemanha, dos Estados Unidos,
da Inglaterra e do Canad ao longo do sculo
XX. A avaliao precisa estar baseada em
conhecimento derivado de anlise e deve ser
destinada a fornecer um quadro completo
da sociedade [...] (Duranti,1993, p. 330). O
arquivo, portanto, o canal de comunicao
que permite aos registros transitarem entre
geraes. Deve ser neutro, para no induzir,
privilegiar ou distorcer os fatos, pois s assim
a anlise de boa qualidade ser possvel. A
profisso arquivstica tem uma responsabilidade
vital com as futuras geraes, de deixar que elas
entendam e julguem nossa sociedade com base
nos documentos que produziu [...] (Duranti,
1993, p. 343). O arquivista no deve confundir
seu papel de preservador dos registros com
o de criador de valor (ao avaliar e selecionar
documentos, descartando aqueles que julgasse
sem utilidade, por exemplo, estaria alterando o
contedo do acervo que deve preservar).

Inf. & Soc.:Est., Joo Pessoa, v.24, n.2, p. 71-81, maio/ago. 2014

73

William Guedes e Rogrio Henrique de Arajo Jnior

3 DIFERENTES
ABORDAGENS
PARA
OS
PROBLEMAS
DE
COMUNICAO
Em 1949, o matemtico Weaver (1949),
publicou o texto Recent Contributions to The
Mathematical Theory of Communication no
qual apresentou interpretaes para o trabalho
de Shannon e forneceu exemplos que facilitaram
sua compreenso. Os dois artigos foram
ento publicados juntos em forma de livro,
na obra assinada por ambos e intitulada The
Mathematical Theory of Communication.
Em seu texto, Weaver dividiu os
problemas de comunicao em trs nveis:
Nvel A Problema tcnico: quo
precisa pode ser a transmisso de
smbolos?
Nvel B Problema semntico: quo
precisamente os smbolos transmitidos
carregam o significado desejado?
Nvel C Problema da efetividade: quo
efetivamente o significado recebido
afeta a conduta da maneira desejada?
(WEAVER, 1949, p. 1).

O problema tcnico est ligado, por


exemplo, transmisso de mensagens escritas
por correio eletrnico, de voz por telefone ou
de imagens e sons por televiso. O problema
semntico est relacionado a quo prximas so
as interpretaes de significado na transmisso
e na recepo o que implica comparar se o
que o emissor quis transmitir foi compreendido
pelo receptor da mensagem. A efetividade
da comunicao a relao entre o resultado
esperado pelo emissor e o que ocorre no
receptor, ou seja, o cotejamento entre o impacto
pretendido pelo emissor com sua mensagem e o
que de fato ocorreu com o usurio da informao.
Weaver entende que o problema de nvel
A no est restrito s especificidades tcnicas
de engenharia, porque o contedo filosfico da
comunicao, associado aos nveis B e C, no
transmitido quando o nvel A insatisfatrio:
A teoria matemtica dos aspectos
de
engenharia
da
comunicao,
desenvolvida
principalmente
por
Claude Shannon no Bell Telephone
Laboratories, reconhecidamente se
aplica em primeira instncia apenas
ao problema A, ou seja, o problema
tcnico de preciso da transferncia de

74

vrios tipos de sinais entre o emissor


e o receptor. Mas a teoria tem, penso
eu, um profundo significado que prova
que o pargrafo anterior seriamente
impreciso. Parte da importncia da nova
teoria vem do fato de que os nveis B e
C, acima, somente podem fazer uso da
preciso daqueles sinais que venham
a ser possveis quando analisados ao
nvel A. Assim, quaisquer limitaes
descobertas na teoria no Nvel A se
aplicam necessariamente aos nveis B e
C. Mas uma maior parte da importncia
vem do fato de que as anlises no nvel
A revelam que este se sobrepe aos
outros nveis mais do que possivelmente
se poderia ingenuamente suspeitar.
Assim, a teoria do Nvel A , pelo menos
em um grau significativo, tambm uma
teoria de nveis B e C. (WEAVER, 1949,
p. 3).

O nvel A envolve escolha, organizao,


codificao e transmisso da mensagem. Os
problemas associados a essas etapas so,
portanto, importantes tambm para os estudos
do ciclo informacional, pois tm reflexos no
armazenamento, na indexao e na recuperao
da informao.
O rudo, por exemplo, definido como
uma perturbao que afeta o sinal transmitido,
em qualquer das etapas do processo, de tal
forma que a informao recebida no seja
exatamente aquela que fora enviada. Um pouco
de redundncia permite que se corrija parte desse
erro, de modo a aproximar a mensagem recebida
da enviada:
Por exemplo, em um canal telegrfico
sem rudo se poderia economizar cerca
de 50% do tempo pela codificao
adequada de mensagens. Isso no feito
e a maior parte da redundncia de ingls
permanece nos smbolos do canal. Isto
tem a vantagem, no entanto, de permitir
considervel rudo no canal. Uma frao
importante de letras pode ser recebida
incorretamente e ainda ser reconstruda
pelo contexto. (SHANNON, 1948, p.
24).

Rudos comuns so as distores sonoras


nas ligaes telefnicas e as interferncias
nas transmisses de televiso por satlite.
Mas em muitos casos as mensagens podem
ser compreendidas, apesar dos rudos,
justamente porque h contedo redundante.
Em outras palavras, os elementos do nvel A da

Inf. & Soc.:Est., Joo Pessoa, v.24, n.2, p. 71-81, maio/ago. 2014

Estudo das similaridades entre a teoria matemtica da comunicao e o ciclo documentrio


comunicao (redundncia e rudo) tm impacto
direto nos elementos dos nveis B e C.
A capacidade de um canal de comunicao
uma medida da quantidade de informao que
pode transitar por ele a cada unidade de tempo.
A informao frequentemente no estar em seu
estado original, mas ter tido sua forma alterada
justamente para que possa ser transmitida. A
essa alterao d-se o nome de codificao.
Tome-se o exemplo de um pensamento. Ele
no transmitido diretamente, mas codificado
em palavras (ou em um desenho, ou em sons), e
essas palavras que so comunicadas (de forma
falada ou escrita). A codificao, portanto, uma
etapa crtica do processo de comunicao. Para
cada canal de comunicao h uma codificao
mais apropriada transmitir um a ideia por texto
requer elementos diferentes da transmisso da
mesma ideia por imagens. A ideia a mesma, o
que difere a codificao, para compatibilizar
a informao a ser transmitida com o canal de
comunicao a ser utilizado.
Weaver alerta para o fato de que o
aperfeioamento da codificao normalmente
implica aumentar o tempo necessrio dessa etapa
codificaes melhores so mais demoradas.
Na prtica, portanto, h um compromisso a se
estabelecer entre o aproveitamento ideal do canal
e a velocidade da comunicao.
Os conceitos discutidos quando da
abordagem tcnica rudo, redundncia,
canal de comunicao, capacidade, codificao
tambm esto presentes na comunicao
humana. Isso torna possvel partir do trabalho de
Shannon e Weaver e realizar estudos de sistemas
de comunicao centrados em significado e
usurios.

4 SIMILARIDADE COM
DOCUMENTRIO

CICLO

Informao,
mensagem,
significado,
semntica e receptor/usurio so termos usados
na cincia da informao e que tambm esto
presentes na teoria matemtica da comunicao,
mas no necessariamente representando os
mesmos fenmenos. [...] A cincia da informao
h muito discute o conceito de informao
[...] (ZINS, 2008). Na teoria matemtica da
comunicao, informao uma medida da
liberdade de escolha que se tem ao se selecionar
a mensagem que ser transmitida. A informao

est relacionada nem tanto ao que diz, mas ao


que se pode dizer WEAVER, e explicitamente
diferenciada de significado.
A palavra informao, nessa teoria,
usada em um sentido especial que
no deve ser confundido com seu uso
comum. Em particular, a informao no
deve ser confundida com significado. Na
verdade, duas mensagens, uma das quais
fortemente carregada de significado e
outra que seja puro disparate, podem
ser exatamente equivalentes, do
presente ponto de vista, em matria de
informao. (WEAVER, 1949, p. 4).

Esse o modo tcnico de abordar o problema. Quando se quer estudar os demais nveis de
comunicao, o significado passa a ter importncia. Convm lembrar a distino entre definio
e conceito proposta por Belkin (1978, p. 58) [...]
uma definio presumivelmente diz o que o fenmeno definido , enquanto que um conceito
um modo de olhar para, ou de interpretar o fenmeno [...]. Shannon (1948) e Weaver (1949)
trabalharam com um conceito de informao que
lhes foi til, sem pretenso de criarem definies:
O conceito de informao no se
aplica s mensagens individuais (como
o conceito de significado), mas sim
situao como um todo, a unidade
de informao indicando que nessa
situao a pessoa tem uma quantidade
de liberdade de escolha, na seleo
de um mensagem, que conveniente
considerar como um padro ou unidade
de valor. (WEAVER, 1949, p. 4).

Como se v, o conceito de informao


usado na teoria matemtica da comunicao
especfico e estend-lo a outras situaes requer
prudncia afinal, no uma definio.
Brookes (1980) estabelece relao entre
o que chama de informao objetiva e de
conhecimento objetivo. O significado est
no conhecimento, que requer interpretao
da informao. Referindo-se informao
que comanda uma mquina, ele afirma que
a informao que ela usa simplesmente
uma sequncia programada de sinais; no foi
estruturada em conhecimento, continua sendo
informao objetiva. A informao objetiva,
portanto, pode ou no ter significado, o que
compatvel com o que foi definido na teoria
matemtica da comunicao.

Inf. & Soc.:Est., Joo Pessoa, v.24, n.2, p. 71-81, maio/ago. 2014

75

William Guedes e Rogrio Henrique de Arajo Jnior


No contexto da cincia da informao,
o ciclo documentrio congrega a produo,
reunio, processamento tcnico, disseminao
e uso de documentos. De um modo mais
completo e detalhado o ciclo documentrio
pode ser considerado um sistema, pois rene
em sua estrutura as trs etapas centrais de
qualquer sistema: entrada, processamento
e sada. As etapas do ciclo documentrio
preparam as etapas subsequentes em um
movimento de retroalimentao constante,
observando sempre o requisito do usurio,
ou seja, o sistema deve estar calcado na
perspectiva do atendimento das demandas
informacionais dos usurios/clientes.
Segundo Robredo (2005), as doze
operaes ou etapas da cadeia ou ciclo
documentrio so:

Seleo: escolha, dentre um conjunto
de documentos, daqueles que podem
responder s disciplinas ou tpicos
cobertos por um dado servio de
documentao. Estes documentos tm
vrios suportes, dentre eles livros,
revistas, documentos de arquivo, mapas,
filmes discos, colees de dados, entre
outros;

Aquisio:
atividade
administrativa
para adoo de providncias de compra,
intercmbio, doao, pagamento, controle
de chegada. No caso de documentos
arquivsticos, a incorporao ao acervo de
uma instituio se dar aps as etapas de
diagnstico e estabelecimento das idades
documentais. De modo amplo, esta etapa
do ciclo documentrio visa assegurar
a incorporao dos documentos aos
acervos;

Registro ou tombamento: atividade
administrativa na qual so atribudos
nmeros de registro para controle da
incorporao
dos
documentos
aos
acervos das unidades informacionais.
Esta atividade de suma importncia
tanto para acervos resultados de
compra ou doao, bem como para
acervos arquivsticos. Nesta etapa fica
consubstanciada
a
identificao
da
existncia dos documentos;

Descrio: atividade de processamento
tcnico relacionada com o registro das
caractersticas descritivas dos documentos.
76

Esta providncia amplamente apoiada


pelo diagnstico situacional das condies
fsicas dos documentos. No caso de
documentos arquivsticos, esta etapa
propicia a compreenso dos princpios
que regem os documentos, assim como as
condies fsicas das massas documentais
acumuladas;
Anlise ou condensao: etapa de
processamento tcnico em que so
desenvolvidas atividades de sumarizao
do contedo dos documentos, por meio
de um nmero limitado de sentenas ou
frases que devem expressar a essncia
temtica do documento. Esta atividade,
segundo Arajo Jr. (2007), denominada
de representao do contedo dos
documentos e realizada com o apoio de
instrumentos de controle terminolgico
baseados em linguagem documentria;
Indexao: atividade de processamento
tcnico destinada identificao dos
conceitos de que trata o documento,
expressando-os na terminologia utilizada
pelo profissional da informao em
linguagem natural ou com a ajuda de
vocbulos ou termos derivados de
linguagens documentrias;
Armazenamento dos documentos: etapa
onde os documentos, a partir de dados
que os descrevam por meio de sistemas
de classificao, so armazenados de
forma a serem encontrados quando
solicitados pelos usurios nas unidades
informacionais. Cada uma destas unidades
possui especificidades de armazenamento
em estantes, arquivos, microfichas,
suportes magnticos, entre outros;
Armazenamento
da
representao
condensada dos documentos: etapa onde
os elementos descritivos do contedo
dos documentos, bem como os nmeros
que lhes foram atribudos na etapa de
registro ou tombamento, constituem
um conjunto de dados que caracteriza,
de forma condensada, cada documento.
Estes elementos devem ser registrados
ou inseridos em bases de dados para
sua
conservao,
processamento
e
recuperao;
Processamento
da
informao
condensada: atividade em que os registros

Inf. & Soc.:Est., Joo Pessoa, v.24, n.2, p. 71-81, maio/ago. 2014

Estudo das similaridades entre a teoria matemtica da comunicao e o ciclo documentrio

que contm os elementos representativos


dos documentos so submetidos a
diversos processamentos manuais ou
automatizados,
que
possibilitam
a
obteno de vrios produtos, nos quais
a informao encontra-se reordenada
e organizada de maneira a facilitar sua
recuperao;
Produtos do processamento: etapa
onde so formados os produtos que
vo compor o portflio das unidades
informacionais. Vrios podem ser os
servios documentrios a serem ofertados
para os usurios. Podem-se destacar
catlogos de diversos tipos, guias de
fundos, cadastros, diretrios impressos
ou eletrnicos, repositrios institucionais,
portais de informao, bases de dados e de
conhecimento entre outros;
Interrogao e busca: etapa na qual a interao entre a gesto do ciclo documentrio e a realizao de pesquisa nos acervos se d por uma ao de comunicao
e mediao entre os profissionais da informao e os usurios da unidade informacional onde o ciclo documentrio se
desenvolve. No mbito das unidades informacionais, esta atividade conhecida
como servio de referncia e se reveste de
grande importncia para a recuperao da
informao; e

Recuperao
da
informao:
esta
etapa do ciclo documentrio constitui a
finalidade do trabalho documentrio. Ela
o resultado das operaes realizadas
no processo de busca. Segundo Arajo
Jr. (2007), a recuperao da informao
reconhecida como a recuperao de
referncias de documentos em resposta
s solicitaes (demandas expressas por
informao).

A figura 2 apresenta uma viso geral


das operaes/etapas do ciclo documentrio
associadas entrada, processamento e sada
elementos tpicos da teoria geral de sistemas.
Considerando que uma das mais
comuns formas de codificao de ideias
a palavra, ento um documento pode ser
visto como um canal de comunicao e,
de forma similar, uma pintura, um desenho,
uma gravao de udio, etc. Desse modo, o
ciclo documentrio tem similaridades com o
um sistema de comunicao, sobretudo no
que se refere s etapas finais do ciclo, ou seja,
processamento da informao condensada,
produtos do processamento, interrogao e
busca e recuperao da informao. Alm
disso, possvel estudar esse sistema a partir
do referencial da anlise do problema tcnico
da comunicao, evidentemente com as
adaptaes conceituais pertinentes.

Figura 2 Etapas do ciclo documentrio

Fonte: Elabrado pelos autores, 2013.

Inf. & Soc.:Est., Joo Pessoa, v.24, n.2, p. 71-81, maio/ago. 2014

77

William Guedes e Rogrio Henrique de Arajo Jnior


Como em toda analogia, preciso deixar
claros os limites e as diferenas com o trabalho de
referncia. Quando a informao tem significado,
trata-se dos nveis B e C definidos por Weaver,
no do nvel A.
A teoria matemtica da comunicao
trata da transmisso de bits. J em um
documento, o que se quer transmitir so ideias,
significados. O contedo de um documento
no a materializao exata das ideias, mas o
resultado da codificao delas em palavras, em
vdeo, etc. Para cada meio de transmisso haver
uma codificao mais eficiente, mas as ideias
essenciais devem estar l, porque so elas que se
quer fazer chegar ao destinatrio.
Para que a comunicao seja bem sucedida,
o destinatrio e o emissor devem utilizar o
mesmo esquema de codificao, de modo que
um entenda o que o outro quis transmitir. Na
elaborao de um texto, por exemplo, o adequado
domnio do idioma e uma construo coerente e
coesa facilitam sua compreenso. Nesse sentido,
ambiguidades funcionam como um rudo na
comunicao, pois permitem ao destinatrio ter
entendimento diferente da inteno do emissor
da mensagem.
Na comunicao humana, o canal de
comunicao o conjunto de capacidades
cognitivas dos agentes envolvidos. De um
lado h o limite da capacidade de transmitir
informaes do emissor sua habilidade para
traduzir as ideias em um raciocnio articulado,
sua fluncia no idioma e no assunto; do outro
lado h o limite do destinatrio para absorver
as informaes, decodificar a mensagem e
compreender o significado que ela contm. Ou
seja, o limite de informao que pode transitar
pelo canal depende da qualidade da codificao,
que afetada pelo meio de transmisso a ser
usado e pelo domnio da linguagem especfica
apropriada ao assunto.
No demais frisar que a codificao
deve estar otimizada para o meio de transmisso:
uma cena ficar mais bem representada por
uma fotografia ou por um desenho do que por
um texto; alguns tipos de dados ficam mais
inteligveis se apresentados em uma tabela, ao
invs de serem descritos em palavras. O papel o
suporte, o meio de transmisso das ideias.
A compreenso dos significados que o
emissor pretendeu transmitir depender tambm
da capacidade de decodificao do destinatrio,
78

o usurio que receber aquele documento e ter


que interpretar o texto e extrair dele as informaes. O sucesso dessa comunicao depender
do conhecimento comum da linguagem, de forma que o que uma pessoa codificou (escreveu) a
outra consiga decodificar (interpretar). O tempo
disponvel, o conhecimento do assunto, o domnio do idioma e a disposio fsica so fatores limitadores desse canal de comunicao.
Portanto, o rudo que pode afetar a
mensagem, a redundncia de seu contedo e
as limitaes do canal de comunicao devem
ser avaliados tambm sob a perspectiva de
suas consequncias para a compreenso, pelo
destinatrio, dos significados que o emissor quis
lhe transmitir.
Mas, qual o propsito de se estudar o
ciclo documentrio tendo por base uma teoria
matemtica? A cincia da informao tem
caracterstica multidisciplinar e oferece aos
pesquisadores possibilidades de buscar em
outras reas de conhecimento elementos que
possam contribuir para sua evoluo.
Assim, tanto a partir de um ponto de
vista terico quanto prtico, cientistas
da informao esto interessados na
estrutura de seus objetos de estudo
informao. Mas, como os exemplos
acima indicam, muitos cientistas sociais e
comportamentais esto interessados em
estruturas subjacentes tambm. Muitos
engenheiros, baseados no trabalho
de Shannon e Weaver, dentre outros,
esto interessados em informaes. O
que, ento, distintivo sobre a teoria
da cincia da informao? Estamos
interessados em informao como
um fenmeno social e psicolgico.
A informao que ns estudamos
geralmente se origina de uma ao
humana, de alguma forma, seja um feixe
de dados emitido de um satlite ou o
texto de um livro sobre a filosofia de
Immanuel Kant. Nosso foco principal,
mas no nico, em informao
registrada e relacionamento das pessoas
com ela. (BATES, 1999, p. 1047-1048).

Os principais conceitos tratados no


modelo de Shannon e Weaver esto presentes
na comunicao humana e possvel
aproveitar parte do que foi desenvolvido
na teoria matemtica da comunicao para
estudar o ciclo documental. As mensagens
humanas, as interpretaes e os significados

Inf. & Soc.:Est., Joo Pessoa, v.24, n.2, p. 71-81, maio/ago. 2014

Estudo das similaridades entre a teoria matemtica da comunicao e o ciclo documentrio


esto sujeitos aos mesmos fenmenos rudo,
redundncia, restrio de canal. H elementos
essenciais a serem transmitidos, h codificao
e decodificao. A explicitao de todos esses
elementos amplia a compreenso de todo o
processo de comunicao e pode contribuir para
aprimorar tanto a produo de documentos de
arquivo quanto as estratgias de armazenamento,
busca e recuperao da informao.
Uma analogia entre o ciclo documentrio e
o esquema de comunicao descrito por Shannon
(1948) est representada na Figura 3.
Figura 3 Analogia entre um sistema de
comunicao e o ciclo documental.

Se o destinatrio tiver um entendimento incorreto sobre uma palavra em um texto, ele atribuir a ela um significado diferente daquele usado
pelo emissor, e sua interpretao do texto ser outra. Ter, ento, havido uma perda (o significado
que o emissor codificou) em decorrncia de um
rudo (um sentido diferente para aquele texto, introduzido pela interpretao do destinatrio).
Na analogia ilustrada na Figura 3, o canal
de comunicao formado pelas capacidades de
transmitir e receber as informaes. Ou seja, o
conjunto das capacidades tcnicas de transmisso
dos documentos, das caractersticas cognitivas
do emissor e do receptor, de seus nveis de
concentrao e de interesse e ainda do tempo
disponvel para a transmisso.

5 CONCLUSES

Fonte: Shannon (1948)

A mensagem um produto intelectual,


a materializao das ideias do emissor o
resultado do processo de codificao , e pode
ser apresentada em diversas formas, cada qual
adequada a um tipo de comunicao. Diferentes
tipos de rudos podem afetar a mensagem,
desde os rudos do tipo tcnico falhas ou
perturbaes em sua transmisso at rudos no
prprio processo de codificao distores no
registro das ideias, que afetaro a capacidade de
compreenso do que se pretendeu comunicar.
Idealmente, o destinatrio deve ser capaz
de extrair do documento exatamente as ideias
que o emissor quis transmitir. Por definio,
toda diferena entre o que se tentou exprimir e
o que o usurio compreendeu pode ser rudo ou
perda. Ser rudo se o usurio recebeu (entendeu,
interpretou) algo que no foi enviado pelo
emissor, e ser perda se algo que foi transmitido
no tiver sido recebido. Note-se que o rudo e a
perda dependem, em parte, do destinatrio da
mensagem.

Diversas etapas do ciclo documentrio


podem ser beneficiadas, em termos de eficincia
e efetividade, se forem levadas em considerao
caractersticas e restries discutidas na teoria
matemtica da comunicao. A seleo, a
aquisio e o tombamento de documentos devem
guardar coerncia com o servio de informao
que se pretende prestar, e isso implica considerar
o canal de comunicao como os usurios vo
solicitar e receber as informaes que buscam.
A descrio, a condensao e a indexao
devem avaliar os efeitos da redundncia presente nos documentos, e tambm o rudo da linguagem. Isso ajuda a dimensionar o prprio arquivo,
facilita o armazenamento e torna a recuperao
mais objetiva. fundamental, porm, que se
mantenha a neutralidade nessas etapas, cuidando-se para no inserir juzos de valor sobre o contedo que se quer preservar.
O processamento da informao condensada ser mais eficiente se o armazenamento tiver
sido de melhor qualidade, e os produtos devero ser apresentados na linguagem adequada ao
usurio (o que equivale codificao apropriada
para cada destinatrio).
A ateno a esses elementos rudo,
redundncia, canal de comunicao, codificao
tem reflexos positivos na etapa de interrogao
e busca, porque o arquivo est em boa forma,
organizado e livre de informaes desnecessrias
ou distorcidas, e acaba por facilitar a recuperao
da informao, que a prpria finalidade do
trabalho documentrio.

Inf. & Soc.:Est., Joo Pessoa, v.24, n.2, p. 71-81, maio/ago. 2014

79

William Guedes e Rogrio Henrique de Arajo Jnior

STUDY OF THE SIMILARITIES BETWEEN THE MATHEMATICAL THEORY OF


COMMUNICATION AND CYCLE DOCUMENTARY
Abstract

This study, in the context of information science, addresses the mathematical theory of communication
proposed by Claude Shannon in 1948 and its similarities with the cycle documentary regarding
the stages ranging from selection, storage and processing technical documents, until the recovery
of information retrieval by users. The theme is introduced by presenting four strands among the
many communication systems approaches in information science, represented by: 1. scientific
communication; 2. dichotomy between natural and documentary languages; 3. insertion of the
mathematical theory of communication and into the information science 4. documentary cycle,
which has in the information retrieval step the most significant one from the point of view of a
communication system. Presents the definition, scope and characteristics of the mathematical theory
of communication, strengthening its pioneering character to propose, under solid basis, the calculation
of the amount of information that can be carried over a communication channel. Also addresses issues
relating to neutrality of the communication channel that are present in discussions on information
science, taking as an example the evaluation of documents in archival theory. Finally, are delimited
the similarities of the mathematical theory of communication with the documentary cycle, where
a document may be seen also as a communication channel, as well as any support that present
information to be treated from the documentary point of view.

Key words:

Information Science. Mathematical theory of communication. Documentary chain. Communication


systems.

Artigo recebido em 20/07/2013 e aceito para publicao em 19/07/2014

REFERNCIAS
ARAJO JUNIOR, R. H. de. Preciso no
processo de busca e recuperao da informao.
Braslia: Thesarus, 2007.
BATES, M. J. The invisible substrate of
information science. Journal of American
Society of Information Science, v. 50, n. 2, p.
1043-1050, 1999.
BELKIN, N. J. Information concepts for
Information Science. Journal of Documentation,
vol. 34, n. 1, p. 55-85, 1978.
BROOKES, B. C. The foundations of Information
Science: Part I. Philosophical aspect. Journal of
Information Science, vol. 2, n. 3-4, p. 125-133,
1980.
COLE, C. Calculating the information content
of an information process for a domain expert
using Shannons Mathematical Theory of
Communication: a preliminary analysis.
Information Processing & Management, v. 33,
n. 6, p. 715-726, 1997.
80

DURANTI, L. The concept of appraisal and


archival theory. The American Archivist, vol. 57,
n. 2, p. 328-344, Spring. 1994.
FIDALGO, A. Informao e Redundncia.
Os quadros da incerteza. In: SANTOS, J. M.;
CORREIA, J. C. (Orgs). Teorias da Comunicao.
Covilh: Universidade da Beira Interior Editora,
2004. p. 15-28.
GUEDES, W. Necessidades informacionais da
auditoria pblica: estudo qualitativo do fluxo
de informao a partir da teoria matemtica
da comunicao. 2013. Dissertao (Mestrado
em Cincia da Informao) Universidade de
Braslia.
PERUCCHI, V. ARAJO JR. R. H de. Produo
cientfica sobre inteligncia competitiva da
Faculdade de Cincia da Informao da
Universidade de Braslia. Perspectivas em
Cincia da Informao, v.17, n.2, p.37-56, abr./
jun. 2012.
SHANNON, C. E. A Mathematical Theory of
Communication. The Bell System Technical

Inf. & Soc.:Est., Joo Pessoa, v.24, n.2, p. 71-81, maio/ago. 2014

Estudo das similaridades entre a teoria matemtica da comunicao e o ciclo documentrio


Journal, v. 27, p. 379-423, 623-656, 1948.
Available in: <http://cm.bell-labs.com/cm/ms/
what/shannonday/shannon1948.pdf>. Access:
03 jul. 2013.

WERSIG, G.; NEVELING, U. The phenomena of


interest to information science. The information
Scientist, v.9, n4, Dec. 1975.

WEAVER, W. Recent contributions to The


Mathematical Theory of Communication,
Sep 1949. Available in: <http://ada.evergreen.
edu/~arunc/texts/cybernetics/weaver.pdf>.
Access: 03 jul. 2013.

Inf. & Soc.:Est., Joo Pessoa, v.24, n.2, p. 71-81, maio/ago. 2014

81

You might also like