You are on page 1of 14

Sistemas Informticos para anlise de dados

demogrficos: uma abordagem histrica


VII Congresso da ADEH
Granada, Abril de 2004

Antero Ferreira
anteroferreira@neps.ics.uminho.pt

Ao delinear esta sesso tnhamos como principal objectivo proporcionar um


momento de encontro e de reflexo a todos os investigadores que trabalham nesta rea
de intercepo entre a Demografia e a Informtica. Interessava-nos, acima de tudo,
reflectir sobre os vrios ensaios de tratamento das fontes, sobre os esforos de
reconstruo nominativa e sobre a extraco e anlise da informao das bases de dados
demogrficas.

1. A Demografia Histrica: fontes e metodologias.

O nascimento da demografia histrica, em meados dos anos 50, com os


trabalhos pioneiros de Pierre Goubert e Louis Henry, esteve associado explorao de
um tipo particular de fontes: os registos paroquiais, existentes na generalidade dos
pases europeus a partir do sculo XVI. O desenvolvimento de uma metodologia
especfica para a sua explorao, o mtodo de reconstituio de famlias de FleuryHenry, possibilitou o alargamento da anlise demogrfica para perodos anteriores aos
recenseamentos modernos.
A descoberta dos registos paroquiais como fonte para a histria da populao,
associada a uma metodologia rigorosa e que produzia resultados seguros, abria o
caminho a um melhor conhecimento do passado, particularmente do homem comum.
Esta linha de investigao teve uma enorme repercusso, pois partia de um tipo de fonte
que existia, com caractersticas semelhantes, em quase todos os pases cristos o que
possibilitaria a utilizao das mesmas metodologias e a comparao de resultados,
abrindo fecundas perspectivas de investigao. A multiplicao deste tipo de estudos
1

por toda a Europa foi apresentando uma realidade diversa das expectativas iniciais, pois
as fontes no tinham em todos os pases, por variadas razes, a mesma qualidade. Desta
diversidade foram surgindo metodologias alternativas, adaptadas s especificidades das
fontes, das quais destacaramos, entre outras, os trabalhos do Cambridge Group for the
History of Population and Social Structure, que, perante as limitaes das fontes
inglesas, desenvolveu tcnicas de anlise agregativa, e a Metodologia de Reconstituio
de Parquias, desenvolvida por Norberta Amorim nos anos 70 para as fontes
portuguesas, que permite acompanhar em encadeamento genealgico o percurso de vida
de cada indivduo.
Sendo por natureza um campo interdisciplinar, ponto de encontro de
historiadores, gegrafos, socilogos, antroplogos, economistas, mdicos, a demografia
histrica foi abrindo as portas a outro tipo de fontes nominativas (testamentos, fontes
fiscais e administrativas, registo de propriedades, registo dos tribunais civis e
eclesisticos, etc.) que, cruzadas com os registos paroquiais, permitiam iluminar novas
dimenses da vida dos homens no passado.
Todas estas investigaes, independentemente das opes metodolgicas,
assentam num princpio comum que poderamos denominar, de modo genrico: o
cruzamento de informao nominativa, isto , a tentativa de reconstituir as relaes
existentes entre referncias nominativas, respeitantes a indivduos ou famlias,
encontradas em diferentes documentos. Esta perspectiva metodolgica coloca grandes
dificuldades ao nvel do rendimento do trabalho do investigador pois ao tempo
dispendido na recolha da informao registada nos registos paroquiais, acresce o
manuseamento de uma enorme quantidade de fichas para se proceder a cada um dos
cruzamentos nominativos. Louis Henry estimava que eram necessrios seis meses de
trabalho para um investigador isolado conseguir reconstituir um perodo de 100 anos
numa comunidade de 500 habitantes. Esta situao conduzia a uma dupla reduo da
investigao: privilegiava-se o estudo das pequenas comunidades e limitava-se o
perodo de investigao.1 No de estranhar que perante tais dificuldades os
historiadores demgrafos comeassem a interessar-se pelos avanos de outra jovem
cincia, deveras promissora, a Informtica.
A este propsito, no prefcio obra de Louis Henry sobre as antigas famlias de
Genebra, em 1956, Alfred Sauvy afirmava que A automao no pode ser introduzida

Sobre estas limitaes metodolgicas ver Jacques Dupquier (1984). Pour la demographie Historique. Paris: PUF.

na explorao dos registos paroquiais e das genealogias2. Nessa altura no seria


possvel imaginar, certamente, o desenvolvimento e a importncia que a informtica
assumiu no nosso mundo actual. Ainda no incio dos anos 80, trinta anos mais tarde,
Jacques Dupquier afirmava que O custo da introduo de dados actualmente to
elevado que tem de se pensar duas vezes antes de tomar a deciso de os tratar atravs de
tcnicas informticas.3 Apontava nessa oportunidade como principais limitaes
utilizao da informtica, a necessidade de formalizar os ficheiros, o tratamentos e
mesmo a recolha dos dados em funo dos sistemas de tratamento da informao, das
linguagens e at da estrutura das mquinas. A descrio de alguns dos obstculos que o
historiador enfrentava no podem, hoje, deixar de nos fazer sorrir: linguagens mquina
desenvolvidas para serem utilizadas pelos matemticos e fsicos, carto perfurado,
banda magntica, etc.
Esperanado com o advento da micro-informtica declarava premonitoriamente:
Com os mini-computadores dotados de um teclado, de um ecr e de uma impressora, o
historiador-demgrafo pode, ele prprio, introduzir os dados e elaborar os seus
programas. O material no custa sequer o preo de um automvel, e provvel que
ainda baixe mais. (Dupquier, 1984:130)
Se a Informtica aparecia como uma soluo para as dificuldades da demografia
histrica, o seu incipiente desenvolvimento, o grau de especializao que exigia, os
enormes investimentos envolvidos, dificultavam, na altura, a aposta nesta soluo.
Alguns dos obstculos referidos pelos investigadores na relao com a informtica, so
bem o testemunho das dificuldades encontradas nesse perodo: problemas de introduo
de informao; necessidade de desenvolvimento de software especfico, o que colocava
o historiador na dependncia do programador; linguagens de programao que no
foram desenvolvidas para o tratamento de informao nominativa e, finalmente,
dificuldade de acesso aos prprios equipamentos que eram raros e carssimos.
Perspectivando a evoluo desta relao, abordaremos de seguida as principais
solues de recolha e tratamento da informao demogrfica com recurso tecnologia
informtica.

2. A Introduo de Informao.
2

Citado por H. Charbonneau e J. Lgar. "O Uso de Computadores em Demografia Histrica." Demografia Histrica Ed. Marclio,
Maria Lusa S. Paulo: Vozes, 97-118.
3
Jacques Dupquier (1984). Pour la demographie Historique. Paris: PUF.

O primeiro problema a enfrentar pelo investigador ao enveredar pela utilizao da


informtica o da introduo da informao no computador. A digitalizao da
documentao com vista ao reconhecimento ptico da informao manuscrita , ainda
hoje, um sonho. Optou-se, portanto, pela transcrio do documento, num processo que
em nada se distinguia do manual. O objectivo final era a constituio de uma ficha
padronizada que representava a informao essencial do registo original.
Os investigadores estavam, por analogia com a recolha manual, conscientes da
importncia desta etapa. Antoinette Fauve Chamoux, em 1972, afirmava que Para um
ficheiro ser rentvel, ele tem que antes de tudo ser bem feito. () Se a transcrio no
rigorosa e estvel, muitas informaes sero eliminadas ou mal interpretadas. Os
riscos de erro na perfurao juntam-se queles cometidos na altura da recolha.4 Esta
recomendao, ainda hoje muito pertinente, recorda-nos a importncia decisiva do acto,
na maior parte das vezes nico e irrepetvel, de transcrio da informao do
documento. Recorde-se que, na maior parte dos casos, estamos perante uma dupla
transcrio, o que traz ainda mais dificuldades: do documento original para uma ficha
em papel; desta para a ficha informtica. Para obviar a estas dificuldades A. Chamoux
dava-nos notcia das vantagens do sistema FORCOD, desenvolvido por M. Couturier e
R. Abehassera, na hora da recolha da informao: Munido de um gravador de som, o
investigador dita o contedo do seu documento tal qual ele se apresenta, sem se
preocupar com a ordem dos elementos. () Como em qualquer ficheiro, a unidade de
base a ficha, mas esta no ter nem estrutura nem dimenso fixas e ser baptizada
como artigo. (CHAMOUX, 1972:1084). Numa abordagem surpreendentemente
actual5 informa-nos que o registo sonoro do documento ser pontuado com definidores
(por exemplo: casamento, ou sepultura) e com descritores (por exemplo: data do
casamento), podendo o investigador criar livremente os descritores que entender. A
informao assim recolhida era posteriormente introduzida no sistema informtico por
um operador.
Este processo de transcrio da fonte documental para o suporte informtico , sem
dvida, um dos aspectos crticos de qualquer sistema. Para alm da dificuldade de
representar num modelo informtico a riqueza e diversidade de documentos que, em
regra, no so normalizados o investigador enfrenta ainda o problema da codificao e
4
5

Antoinette Chamoux (1972). La reconstitution des familles: espoirs et realits. Annales ESC, 27(4-5), 1083-1090.
Note-se a semelhana entre esta abordagem e a da anotao de documentos em XML (FLIX et al, 2002).

da introduo dos dados. As possibilidades de erro durante estas operaes so muito


elevadas, pois trata-se de processos mecnicos e repetitivos, e dificilmente detectveis
no futuro.
portanto fundamental que o investigador defina claramente o mbito da sua
pesquisa e efectue uma anlise exaustiva da informao disponibilizada pela fonte, de
modo a recolher o mximo de informao possvel numa nica operao de consulta.
Um outro aspecto, muitas vezes descurado mas fundamental para determinar o
sucesso de um sistema informtico, o interface com o utilizador. fundamental que
ele se aproxime das lgicas habituais de trabalho do investigador, para garantir a sua
aceitao, que seja funcional e que proporcione automaticamente algumas validaes de
coerncia bsicas (por exemplo: data de bito no pode ser inferior data de
nascimento, etc.)
Nos dias de hoje dispomos de outras possibilidades nem sempre exploradas!
Podemos transportar o computador para junto dos documentos, introduzindo os dados
directamente no sistema, reduzindo as operaes de transcrio e consequentemente as
hipteses de erro; poderamos recuperar o processo de transcrio sonora do documento,
apostando em tcnicas de reconhecimento de voz; poderamos ainda investir na
digitalizao dos documentos, armazenando na BD, para alm da informao
normalizada, a imagem do documento. Esta ltima possibilidade, cada vez mais
exequvel graas ao desenvolvimento tecnolgico e diminuio de preo do hardware
de armazenamento, tem a enorme virtualidade de possibilitar a qualquer momento o
regresso ao documento, diminuindo assim as hipteses de erro.

3. O Cruzamento de Informao Nominativa

Nas palavras de Charbonneau e Lgar: O cruzamento nominativo o processo


de pesquisa e de reagrupamento dos elementos relativos a uma mesma unidade
(indivduo, casal, famlia). Repousa essencialmente nas relaes de parentesco, que
associam os nomes entre si e permitem identificar os indivduos e casais. 6
Nos trabalhos pioneiros com aplicaes informticas j se notavam diferentes
tipos de abordagem a esta problemtica: alguns investigadores acentuavam a
perspectiva do cruzamento automtico da informao, outros apostavam mais numa

H. Charbonneau e J. Lgar (1979). O Uso de Computadores em Demografia Histrica. S. Paulo: Vozes, p. 100

reconstruo semi-automtica, em que o investigador reserva para si um papel


fundamental. Este percurso deixou-nos importantssimos contributos tericos que
convm recordar pela actualidade que ainda hoje se revestem.
Todos temos presente as dificuldades que a especificidade das fontes utilizadas
pela demografia histrica aportam ao cruzamento nominativo: o caso dos homnimos,
as variaes ortogrficas dos nomes, a irregularidade na transmisso e utilizao dos
apelidos, a identificao incompleta dos indivduos e dos laos de parentesco nos
registos paroquiais, etc.
Perante tais dificuldades a resposta mais bvia seria a de que o computador
jamais conseguir, de forma automtica, reconstruir estas relaes este papel estar
sempre reservado ao historiador. Neste sentido, Charbonneau e Lgar afirmavam que
os computadores no podem ser tomados como uma panaceia. () (as mquinas) no
suprimem todo o trabalho manual, especialmente quando se trata de resolver os casos
muito ambguos. (Charbonneau, 1979:98). Em sentido inverso, cabe aqui recordar o
desafio de Roger Schofield: se o raciocnio do historiador tem alguma pretenso de
respeitabilidade intelectual, os princpios em que se baseia tm de ser especificveis em
forma algortmica e, portanto, ser executveis automaticamente pelo computador, sem
qualquer interveno humana. (Schofield, 1992:75)
Grande parte das tentativas de reconstituio automtica de famlias baseia-se,
directa ou indirectamente, nos trabalhos pioneiros de H. B. Newcombe que, num
famoso artigo de 1959, intitulado Automatic Linkage of Vital Records, apresentava
uma srie de hipteses muito sugestivas. Para ele: O registo dos vrios factos
respeitantes a um indivduo efectuado rotineiramente nas sociedades contemporneas
constituiria, se reunido, uma histria extensivamente documentada da sua vida.7 O
principal obstculo para atingir esse objectivo era, na sua opinio, o elevado custo da
pesquisa manual de um elevado nmero de documentos em ficheiros de grandes
dimenses. A mecanizao destas pesquisas poderia ser efectuada se se demonstrasse
que as mquinas poderiam realizar as ligaes entre registos de um modo rpido, barato
e com suficiente preciso.
Newcombe estava interessado em analisar a fertilidade diferencial das famlias,
tendo em considerao a presena ou a ausncia de doenas hereditrias. O processo
que desenvolveu procurava ligar automaticamente os registos de nascimento ao registo
7

H. B. Newcombe;J. M. Kennedy, S. J. Axford & A. P. James (1959). Automatic Linkage of Vital Records. Science, 130(3381),
954-959.

de casamento correspondente. O ficheiro de casamentos era pesquisado em busca da


ocorrncia dos nomes/apelidos dos progenitores, previamente codificados foneticamente
segundo o Russel Soundex Code8 para evitar os problemas com diferentes grafias. Para
possibilitar ao computador decidir qual casamento correspondia a um determinado
nascimento eram utilizados outras variveis (o nome completo da me e do pai, as suas
naturalidade, idades, ocupaes, etc.). A cada concordncia era atribuda uma pontuao
positiva, a cada discordncia uma pontuao negativa. O nascimento era relacionado
com o registo de casamento que obtivesse a pontuao mais elevada este , sem
dvida, o aspecto mais inovador desta proposta.
Os projectos de reconstituio automtica de famlias mais conhecidos, o
desenvolvido pelo Cambridge Group na Inglaterra e o da Universidade de Montreal, no
Canad, baseiam-se nos princpios enunciados por Newcombe.
O sistema desenvolvido no Cambridge Group, pela equipa de Wrigley e
Schofield, surge associado tentativa de reconstruo dos registos de parquias
urbanas, ou de grupos de parquias, que, pela grande quantidade de registos envolvidos,
desaconselhava a reconstruo de famlias pelos processos tradicionais. A sua grande
aposta metodolgica centrou-se na clarificao da natureza das decises que o
investigador assume no estabelecimento de relaes entre dois registos nominativos, de
modo a construir um algoritmo que o computador pudesse utilizar com o mesmo grau
de sucesso que o investigador.
Um dos principais problemas que o sistema tinha de enfrentar era o das
variaes ortogrficas, que teria de ser previamente resolvido pelo investigador de modo
a que os registos que se referem mesma pessoa pudessem ser relacionados. Esta
operao, mesmo que realizada pelo computador, ter sempre de ser assistida pelo
investigador, pois exige um profundo conhecimento das fontes e do meio sobre o qual
incide a investigao.
Admitindo que se consegue ultrapassar eficazmente o problema das variaes
ortogrficas, um outro importante problema se coloca, o do relacionamento de registos
que se referem ao mesmo indivduo, dadas as possibilidades de existncia de indivduos
homnimos. No estabelecimento destes relacionamentos o Grupo de Cambridge recorre
proposta de Newcombe, tentando resolver as ambiguidades existentes com recurso
8

O Russel Soundex Code um algoritmo desenvolvido originalmente no incio do sculo XX por Margaret K. Odell e Robert C.
Russel no U.S. Bureau of Archives para simplificar o tratamento dos recenseamentos. Traduz-se o nome por um cdigo fontico de
forma a poder ultrapassar o problema de diferentes grafias do mesmo nome. O prprio Henry desenvolveu tambm um sistema de
transcrio fontica de nomes e outros exemplos podem ser encontrados nos trabalhos desenvolvidos por David Reher para
Espanha.

comparao de todos os identificadores disponveis que so pontuados em funo da


existncia ou ausncia de informao concordante. O sistema aceitar como verdadeira
a relao que obtiver maior pontuao.
Os testes de controlo efectuados permitiram aos investigadores concluir que no
havia significativas diferenas entre os resultados da reconstituio automtica e os da
reconstituio manual, embora os primeiros sejam obtidos em muito menos tempo.
Contudo, Roger Schofield diminui bastante o nosso entusiasmo ao afirmar que
importante enfatizar o grande dispndio de tempo nas tarefas de preparao das fontes
para introduo no sistema e para o cruzamento da informao. (Schofield, 1992:78)
O projecto canadiano, Programme de recherche en dmographie histrique
(PRDH), desenvolvido pela equipa de Hubert Charbonneau e Jacques Lgar a partir de
1968, foi o primeiro a apresentar resultados significativos aplicando a reconstituio
automtica. Contudo, reconhecia logo partida que esta no podia resolver os casos
mais ambguos e que teria de ser completada manualmente numa fase final. Salientava
ainda, tal como Schofield, que as operaes manuais de preparao da informao eram
muito prolongadas. Os procedimentos informticos, semelhantes aos descritos para
Grupo de Cambridge, eram realizados em trs etapas: a triagem subdiviso do ficheiro
em subgrupos interligando os elementos mais susceptveis de pertencer a uma mesma
unidade; o acasalamento aproximao dos elementos reagrupados pela triagem; o
emparelhamento comparao dos elementos acasalados e deciso sobre qual dos pares
formados o mais adequado9. Um outro projecto canadiano, o BALSAC, desenvolvido
pela Universidade do Qubec a partir de 1971, representa tambm um importante
esforo nesta direco da reconstituio automtica, situando-se em termos tericos
dentro dos pressupostos j apresentados. Num artigo em que apresenta as linhas gerais
deste projecto, Grard Bouchard salienta os constrangimentos que o objectivo da
pesquisa representa para os procedimentos da reconstituio automtica. Um estudo
mdico ou genealgico, por exemplo, no se satisfaz com cruzamentos baseados em
critrios estatsticos. Nestes casos, o cruzamento tem de estar baseado na verificao de
um conjunto rigoroso de critrios, reduzindo assim, obviamente, o nmero de
cruzamentos efectuados, mas aumentando o seu rigor10.
O grande desenvolvimento da micro-informtica, particularmente nos anos 90
do sculo passado, colocou nas mos dos historiadores um hardware acessvel, muito
9

H. Charbonneau e J. Lgar (1979). O Uso de Computadores em Demografia Histrica. S. Paulo: Vozes.


BOUCHARD, G. (1992). Current issues and new prospects for computerized record linkage in the province of Quebec. Historical
Methods, 25(2), 67-74.
10

poderoso e ferramentas informticas cada vez mais prximas do utilizador (bases de


dados, folhas de clculo, ferramentas estatsticas). Esta revoluo libertou o
historiador da dependncia de grandes sistemas informticos, forosamente muito
rgidos e dispendiosos, e permitiu-lhe adaptar, com ou sem a colaborao de tcnicos
informticos, estas ferramentas s suas investigaes11.
Neste processo ganham especial relevo os sistemas de gesto de bases de dados
(SGBD) (entre outros o dBase e, mais tarde, o Access) que, pelo seu poder e
simplicidade, permitem que sejam os prprios historiadores a criar as suas bases de
dados, ou a participar activamente no seu desenvolvimento. Ao longo da sua evoluo,
estes SGBD vo permitindo o armazenamento de um volume cada vez maior de
informao, inclusivamente de imagens. O seu verdadeiro poder revela-se na hora de
analisar a informao, pois a flexibilidade do seu sistema de consultas no limita o
investigador a uma srie de questes pr-determinadas. Francisco Ramrez Gmiz, num
interessante artigo em que apresenta a adaptao informtica que desenvolveu para a
reconstruo de famlias nesta regio de Granada, indica-nos claramente o novo papel
que o investigador atribui informtica ao referir que o computador um poderoso
aliado do investigador: Ainda que numa primeira fase o computador proporcione
importante ajuda para armazenar e apresentar a informao, quando nos dispomos a
analis-la e a manej-la que a informtica revela a sua maior utilidade [Ramrez
Gmiz, 2000:3].
O exemplo portugus sintomtico dos avanos que a micro-informtica trouxe
demografia histrica. Desde 1986 que Norberta Amorim tem desenvolvido trabalhos
de reconstituio de parquias com recurso informtica. A metodologia desenvolvida
por esta investigadora, partindo do cruzamento dos registos de baptizados, casamentos e
bitos, apresenta como ltimo objectivo acompanhar o percurso de vida de cada
residente da comunidade em encadeamento genealgico. As bases de dados assim
constitudas so passveis de cruzamento com qualquer outro tipo de fonte nominativa
que aos mesmos indivduos se reporte. Os passos iniciais de Norberta Amorim foram
dados com o desenvolvimento de um sistema informtico recorrendo ao dBase III Plus,
em colaborao com investigadores do Departamento de Informtica da Universidade
do Minho: Lus Lima, Ceclia Moreira e Pedro Henriques. Os resultados obtidos ao

11
Na bibliografia apresentamos um conjunto de ttulos representativo deste processo em pases como Portugal, Espanha, Noruega,
Dinamarca, Brasil.

nvel do rendimento do trabalho foram to significativos que esta adaptao informtica


da sua metodologia passou a ser a base de uma vasta srie de trabalhos de investigao.
Este sistema informtico, na sequncia da metodologia manual desenvolvida por
Norberta Amorim, no segue os passos clssicos de Henry. O investigador introduz os
vrios eventos, comeando pelos nascimentos, mas cria logo nesse passo todas as
relaes familiares. Num registo de nascimento tpico cria trs fichas de indivduos (o
filho, o pai e a me) e uma famlia, no caso em que esta famlia ou estes indivduos, pai
e me, ainda no existem na base de dados. Este procedimento, em que a introduo de
dados e o cruzamento so feitos simultaneamente, representa um ganho em termos de
tempo e em termos de segurana na reconstituio. Em termos de tempo, porque com a
facilidade de pesquisa que o sistema permite a identificao , em regra, muito rpida, e
porque o maior dispndio de tempo se verifica no primeiro nascimento, nos seguintes s
acrescentamos informaes relativas ao novo filho e verificamos se houve alguma
alterao relativa familia. Em termos de segurana, porque a reconstituio feita
num nico passo, no momento em que temos a fonte na mo, o que limita as
possibilidades de erro em sucessivas transcries.
A outra virtualidade deste sistema advm do facto de centrarmos a reconstituio
no indivduo e no na famlia. Esta abordagem permite que sejam introduzidas na base
de dados todos os indivduos referidos nos registos, independentemente de terem ou no
relaes familiares na parquia12. Deste modo, recolhemos informaes que sero muito
teis no sequente processo de cruzamento das bases de dados de vrias parquias,
considerando a grande mobilidade dos indivduos nas sociedades do passado. Por outro
lado, possibilita-nos tambm o cruzamento nominativo com todo o tipo de fontes em
que esse indivduo seja referido.
Estes sucessos e os posteriores desenvolvimentos dos Sistemas de Gesto de
Bases de Dados Relacionais tornaram o historiador demgrafo progressivamente mais
ambicioso: rompeu com as barreiras cronolgicas tradicionais da disciplina ao alcanar
nas suas investigaes o presente das comunidades em anlise e abriu estimulantes
perspectivas para o cruzamento inter-paroquial, tendendo para a formao de uma base
de dados central.

12

A todos os indivduos atribuda uma classificao que indica o conhecimento que possumos dele no
que respeita a actos vitais, por exemplo: nascido na parquia, falecido na parquia, etc.

10

A internacionalizao deste sistema de recolha e tratamento de informao


demogrfica tem vindo a ser ensaiada em Espanha, nomeadamente na Galiza com o
trabalho de Delfina Rodrguez Fernndez, no Brasil e na Argentina.

Este projecto que aqui, de um modo muito simples, descrevemos, um exemplo


dos novos processos de trabalho que esto ao dispor do investigador nesta rea da
demografia histrica. J no estamos a falar de enormes sistemas informticos, sobre os
quais se discutia o custo/hora de utilizao dos laboratrios de uma qualquer
universidade. Estamos perante programas que podem ser utilizados num sistema
pessoal, desenvolvidos em SGBD relacionais, com uma estrutura de dados
estandardizada. Trata-se de sistemas abertos, nos quais o investigador pode facilmente
introduzir uma nova varivel de anlise ou uma nova hiptese de trabalho.
Actualmente o investigador social tem tambm sua disposio uma srie de
ferramentas que lhe permite proceder de forma autnoma explorao da informao
organizada atravs dos SGBD. De facto, se estes permitem realizar a maior parte das
contagens e at alguns clculos estatsticos, no tm, obviamente, o desempenho de
ferramentas desenvolvidas especificamente para esse efeito.
Ao longo das duas ltimas dcadas do sculo XX, dois tipos de aplicaes
desempenharam este papel: as folhas de clculo (como o Lotus e o Excel) e os pacotes
estatsticos (como o SAS ou o SPSS). Este tipo de ferramentas, integrando-se
perfeitamente com os SGBD, e apresentando grande simplicidade de utilizao, coloca
na mo do historiador um poder de anlise que depende mais da sua imaginao do que
das limitaes do software.
A Internet veio neste campo, como em tantos outros, abrir novas possibilidades
aos vrios grupos de investigao. Gostaramos aqui de abordar um aspecto em
particular: o da difuso das bases de dados genealgicas. A importncia da informao
recolhida pelo historiador-demgrafo no se limita sua disciplina! As comunidades
desejosas de conhecer as suas razes, nomeadamente os genealogistas amadores, tm
grande interesse na consulta destes dados. A Internet fornece-nos o meio de
proporcionar-lhes o acesso informao. Existem j alguns exemplos desta orientao
sobre os quais devamos reflectir, at pela utilidade social que representam: no Canad o
Programme de recherche en dmographie histrique (www.genealogy.umontreal.ca) e
o Projecto BALSAC (www.uqac.ca/balsac), na Inglaterra, o Projecto de Macfarlane

11

sobre Earls Colne (linux02.lib.cam.ac.uk/earlscolne), em Portugal o projecto do NEPS,


(www.eng.uminho.pt/~neps).

4. Concluso

A informtica uma cincia com um papel fundamental no trabalho do


investigador social. No , contudo, nenhuma panaceia milagrosa! Alis, pela facilidade
de tratamento de grandes quantidades de informao, pode at tornar-se uma fonte de
problemas quando o investigador no delimita concretamente o seu campo de trabalho.
Quando bem utilizada, pela capacidade de anlise que proporciona, desafia-nos a
alargar os horizontes de investigao, a enriquecer a reflexo metodolgica e,
consequentemente, a colocar novas interrogaes para melhor compreender a
complexidade do homem.
A evoluo da relao da informtica com a demografia histrica, que aqui
expusemos de forma breve e pouco exaustiva, um exemplo de sucesso. Parece-nos que
esse sucesso radica em parte no facto de a demografia histrica dispor, desde Henry, de
uma metodologia segura para a reconstituio nominativa e da importncia que a
dimenso quantitativa tem nesta rea das cincias sociais. Contudo, a evoluo mais
recente da informtica permitiu-lhe tambm responder ao desafio do tratamento de
dados qualitativos, sedimentando ainda mais o seu importante contributo para a
demografia.
A apresentao que fizemos da evoluo de alguns dos principais sistemas
informticos de recolha e anlise de informao demogrfica, pretendeu acima de tudo
recordar o percurso que nos conduziu at hoje e a diversidade de solues avanadas
para dificuldades que ainda no ultrapassamos. Para alm das diferentes opes tericas
que fomos reproduzindo, gostaramos de destacar neste percurso duas grandes fases: a
primeira, a dos grandes projectos, alicerados no desenvolvimento de grandes sistemas
informticos centralizados, envolvendo grandes recursos humanos e financeiros o
caso dos projectos do Canad, de Cambridge e, de certo modo, do INED em Frana; a
segunda fase, a dos pequenos grupos de investigao que, graas aos recentes
desenvolvimentos da informtica, centrados no utilizador, recorre a software de
utilizao genrica para, em pequenas equipas, prosseguir os seus projectos de
investigao o caso de alguns projectos referidos em Espanha, Portugal, Dinamarca,
Noruega, etc..
12

O trabalho com estas ferramentas informticas, acessveis a qualquer


investigador, facilita o intercmbio de experincias e at de dados entre diversos
projectos. O confronto entre diversas solues para problemticas semelhantes conduz,
necessariamente, a um enriquecimento da investigao. esta, sem dvida, a principal
motivao desta reunio.

BIBLIOGRAFIA
AMORIM, Maria Norberta. "Rebordos e a sua Populao nos sculos XVII e XVIII. Estudo
Demogrfico." Lisboa: Imprensa Nacional Casa da Moeda, 1973.
AMORIM, Maria Norberta. "Evoluo Demogrfica de trs parquias do Sul do Pico." Lisboa:
Universidade do Minho - Instituto de Cincias Sociais, 1992.
BEAUCHAMP, Pierre, CHARBONNEAU, H., DESJARDINS, B., and LGAR, J. "La reconstitution
automatique des familles: un fait acquis." Population Nmero Especial (1977): 374-399.
AMORIM, Norberta et al. "Reconstituio de parquias e formao de uma base de dados central." VI
Congresso da ADEH, Castelo Branco (2001):
AMORIM, Maria Norberta;LIMA, Lus. "Demografia Histrica e Micro-Informtica uma experincia
sobre uma parquia aoreana." Boletim do Instituto Histrico da Ilha Terceira XLIV (1986):
AMORIM, Maria Norberta. "Guimares de 1580 a 1819. Estudo demogrfico." Lisboa: INIC, 1987.
AMORIM, Maria Norberta. "Informatizao normalizada de arquivos, reconstituio de parquias e
histria das populaes." Lisboa: Universidade do Minho - Instituto de Cincias Sociais, 1995.
BOUCHARD, G., and RAYMOND, R.;OTIS, Y. "Registre de Population et Substitutions Nominatives."
Population.3 (1985): 473-490.
BOUCHARD, G. "Current issues and new prospects for computerized record linkage in the province of
Quebec." Historical Methods 25.2 (1992): 67-74.
CHCON JIMNEZ, F. , and GARCIA GONZLEZ, F. "Informe sobre el encuentro internacional
"Famlia, Genealoga e Informtica"." Boletn de la Asociacin de Demografia Histrica X.3 (1992): 143148.
CHAMOUX, A. F. "La reconstitution des familles: espoirs et realits." Annales ESC 27.4-5 (1972):
1083-1090.
CHARBONNEAU, H., and LGAR, J. "O Uso de Computadores em Demografia Histrica."
Demografia Histrica Ed. Marclio, Maria Lusa S. Paulo: Vozes, 1979. 97-118.
DAUBEZE, Y.;PERROT, J.-C. "Un programme d'tude dmographique sur ordinateur." Annales ESC
27.4-5 (1972): 1047-1070.
DUPQUIER, Jacques. "Pour la demographie Historique." Paris: PUF, 1984.
FLIX, Rafael, FARIA, Fernanda, SANTOS, Maribel, and HENRIQUES, Pedro R. "XML na
Demografia Histrica: anotao de registos paroquiais." Braga: Universidade do Minho, 2002.
FERREIRA, Antero. "Demografia Histrica e estudos genealgicos." Boletim Informativo do NEPS.27
(2002): 1-2.
FERREIRA, Antero. "Sistema de Aquisio de Dados para a Reconstituio de Parquias." Braga:
Universidade do Minho, 2001.

13

FLEURY, M.;HENRY, L. "Nouveau manuel de dpouilement et d'exploitation de l'tat civil ancien."


Paris: INED, 1965.
FURE, Eli. "Interactive Record Linkage: The cumulative construction of Life Courses." Demographic
Research 3 (2000):
MORRIS, R. J. "Qualitative to Quantitative by way of coding and nominal record linkage. The search for
the british middle class." History of Computing 11.1 e 2 (1999): 9-30.
NEWCOMBE, H. B. et al. "Automatic Linkage of Vital Records." Science 130.3381 (1959): 954-959.

RAMREZ GMIZ, Francisco. "Ordenadores e microanlisis nominativo." Scripta Nova - Revista


Electrnica de Geografia y Ciencias Sociales.65 (2000).
REHER, David. "The history of the family in Spain: Past development, present realities, and future
challenges." History of the Family 3.2 (1998): 125-137.
REHER, D. et al. "Processos de modernizacin y trayectorias de vida. Propuesta para el anlisis
sociodemogrfico a partir de datos locales en espaa." VI Congresso da ADEH, Castelo Branco (2001):
SCHOFIELD, Roger. "Automatic family reconstitution." Historical Methods 25.2 (1992): 75-80.
SCHOFIELD, R. "La reconstitution des familles par ordinateur." Annales ESC 27.4-5 (1972): 1071-1082.
SCHOFIELD, Roger. "History, Computing and the emergence of the Population History of England,
1541-1871: a reconstruction." History and Computing 11.1 e 2 (1999): 79-102.
SCOTT, Ana Slvia. "O desafio do cruzamento nominativo a partir de fontes portuguesas." Boletim
Informativo do NEPS.3 (1998): 5-12.
WRIGLEY, E. A.;SCHOFIELD, Roger. "Identifying people in the past." Londres: Edward Arnold
Publihers, 1973. 1

14

You might also like