You are on page 1of 43

Guia para digitalizao de documentos Verso 2.

Embrapa Informao Tecnolgica Fevereiro 2006

Verso de 2001, Grupo de trabalho. Anna Christina Aun de Azevedo Nascimento Cristiane Vieira Peres Maria Jos de Oliveira Karla Igns Corvino Silva

Verso de 2006 Reviso de Anna Christina Aun de Azevedo Nascimento


Empresa Brasileira de Pesquisa Agropecuria Embrapa SCT Fevereiro de 2006. Braslia, DF

Introduo
Em 2001, a Embrapa Informao Tecnolgica, por meio de sua Gerncia de Organizao da Informao tomou a iniciativa de desenvolver um Guia Geral de Digitalizao de Documentos visando orientar as atividades de digitalizao dos documentos da Empresa. Alm disso, o Guia tambm teve como propsito a preservao de originais que materializavam as atividades do capital intelectual da Embrapa, ao mesmo tempo que proporcionava maior disseminao de seus contedos. Em dezembro de 2005 a nova verso comeou a ser produzida com o objetivo de revisar e atualizar o documento original. A Embrapa Informao Tecnolgica novamente financiou o Guia de Digitalizao cumprindo a sua funo de estimular e orientar as Unidades da Embrapa no processo de organizao da informao, assim como integr-las e torn-las parte de uma grande rede de fornecedores de informaes digitais. recomendvel que esse Guia seja utilizado para ajudar o desenvolvimento do planejamento e implementao de digitalizao de materiais. Recentemente tem-se verificado a importncia de se aplicar tcnicas e padres de forma inteligente e consistente nos procedimentos relacionados a desenvolvimento e publicao de contedos digitais. O uso de padres, alm de adicionar longevidade e escalabilidade ao ciclo de vida dos materiais, tambm possibilita a um pblico ainda maior do que o originalmente pensado a descobrir e usar os recursos de informao. Um dos objetivos desse Guia de Digitalizao mostrar a importncia de se pensar na questo da sustentabilidade dos programas. Ao adotar prticas que possibilitam o compartilhamento dos recursos produzidos pela Empresa, possvel assegurar um uso mais abrangente dos materiais. Tanto hoje quanto no futuro, audincias que nem mesmo foram consideradas podero estar se 3

beneficiando dos contedos digitais e fazendo novas combinaes e criando novos recursos. A padronizao assegura a qualidade, consistncia e segurana dos recursos, e faz com que eles sejam compatveis com os recursos de outras projetos. Iniciativas que utilizam essa abordagem promovem escalabilidade e

podem ser mantidas e gerenciadas com o mximo benefcio para todos. Resumindo, uma boa prtica de digitalizao de materiais pode ser avaliada pela sua capacidade de maximizar a utilizao desses recursos enquanto minimiza o custo de sua manuteno e uso.

Finalidade
O propsito deste documento oferecer orientaes bsicas e prover recomendaes mnimas necessrias digitalizao de materiais em formatos de texto, fotografia, mapas e ilustraes. Este guia no deve ser considerado como o melhor padro disponvel para digitalizao, mas sim como um recurso de orientao para a captura de imagem, apresentao, armazenagem e preservao de originais. Alm disso, o guia fornecer aos autores de materiais, tcnicos e dirigentes da empresa, orientaes necessrias para que eles possam avaliar se determinada estratgia de digitalizao proposta adequada ou no ao seus objetivos e materiais. Apesar deste documento no ter a inteno de ser a ltima palavra no assunto, ele pode ser utilizado como uma referncia para aqueles que esto iniciando procedimentos de digitalizao e publicao de seus recursos de informao. Este guia contempla principalmente orientaes que propem: Aumentar a interoperabilidade entre os diversos repositrios de contedos digitais.

Assegurar a acessibilidade aos recursos atravs do uso de padres e formatos amplamente aceitos.

Possibilitar o uso dos materiais por diversos pblicos. Incorporar procedimentos que estimulam a preservao dos materiais originais. As tecnologias esto constantemente mudando e se aperfeioando, portanto, este guia um trabalho em constante desenvolvimento. Seus comentrios e sugestes so bem vindos para complementar as orientaes aqui propostas.

Princpios gerais
Escanear na maior resoluo possvel apropriada para a natureza do material original. Escanear em nvel de qualidade apropriado para evitar o re-trabalho e remanuseio dos originais no futuro. Criar e armazenar um arquivo mestre que poder ser utilizado para produzir arquivos de imagens derivadas que atendam a uma variedade de necessidades atuais e futuras. Preferir sistemas no-proprietrios. Utilizar formatos de arquivos e tcnicas de compresso em conformidade aos padres mais amplamente utilizados pelas comunidades que utilizam as informaes da EMBRAPA. Criar cpias de segurana de todos os arquivos em mdias estveis. Criar metadados significativos para os arquivos de imagens ou colees. Armazenar a mdia em ambiente apropriado. Documentar estratgias de migrao para transferncia de dados atravs das geraes de tecnologia.

Tpicos do Guia de Digitalizao


Introduo.................................................................................................. .3 Finalidade............................4 Princpios gerais ........................................................................................6 Planejamento........................................................................ .......... ............9 Fases do planejamento ... ..................................................... .......... .......... 10 Formas gerenciais de produo digital........................................................ 11 Na prpria Instituio ............................................................ .................... 11 Terceirizao ......................................................................................... 12 Audincia alvo........................................................................................... 13 As demandas e necessidades.................................................................... 14 A seleo de materiais......................................................... ....................15 Caractersticas do material original ............................16 Propriedades fsicas dos materiais ........................................................... 17 Objetivos da digitalizao........................................................................... 18 Direitos autorais ........................................................................................ 19 Equipamento............................................................................................. 19 Computador ............................................................................................... 20 Monitor ........................................................................................................20 Gravador de CD-DVD ................................................................................ 21 Porta de transferncia de alta velocidade .................................................. 21 Scanners ................................................................................................... 21 Resoluo.................................................................................................. 21 Profundidade de cores ............................................................................. . 22 rea de escaneamento .............................................................................. 22 Tempo de digitalizao .............................................................................. 22 Usabilidade .................................................................................................23 Cmeras digitais ...................................................................................... 23 Software..................................................................................................... 24 Criao de arquivos digitais .................................................................. 25 Arquivo mestre.......................................................................................... 26

Arquivo de imagens derivadas ................................................................. 26 Tipos de escaneamento........................................................................... 27 Digitalizao de documentos.................................................................. 28 Recomendaes para texto ...................................................................... 29 Recomendaes para Fotografias............................................................. 30 Recomendaes para Mapas..................................................................... 31 Recomendaes para Material grfico....................................................... 31 Recomendaes para imagens de diferentes funcionalidades ................. 32 Controle de qualidade ............................................................................. 33 Denominao dos arquivos......................................................................34 Armazenagem.......................... 35 Disco rgido ............. 36 CDs............. 36 DVDs............. 36 Metadados e Objetos digitais.................................................................. 37 Anexo I Fontes complementares de informao................................................ Escaneamento........................................................................................... Metadados ............. Outras fontes de informao.....................................................................

38 38 38 39

Anexo II Glossrio................................................................................................... 41

Planejamento
A iniciativa de digitalizar contedo requer um planejamento cuidadoso antes de sua implementao. Tal planejamento deve sempre considerar o plano estratgico da instituio como um todo, desde o de mbito tecnolgico ao de fluxo de trabalho. Um bom planejamento, para qualquer projeto requer um nmero de decises e questes, tais como as que seguem: Qual o trabalho que precisa ser feito; Como ser feito (de acordo com padres, especificaes, modelos bem sucedidos); Quem dever fazer o trabalho; Aonde ser feito; Quanto tempo de trabalho; Qual ser o custo;

O objetivo desta seo alertar para certos tens do processo de planejamento e indicar os pontos decisivos, como: analisar os recursos necessrios, verificar o pessoal e o equipamento requerido, selecionar o tipo adequado de metadados, e a gesto do projeto como um todo. A tecnologia tem se desenvolvido e mudado muito rapidamente nos dias de hoje, portanto parece quase impossvel tomar decises sobre padres, especificaes, equipamento, habilidades e metodologias com total segurana. Porm, para quem est planejando um projeto, no s a preocupao com esses detalhes que garantir uma tomada de deciso acertada. muito mais importante entender os princpios bsicos que envolvem a produo e qualidade da converso digital do que saber a capacidade que oferece um determinado equipamento. Esses princpios se aplicam de forma geral e sofrem menos

mudanas e de forma bem mais lenta. Com esse conhecimento, o gestor de um

projeto de digitalizao pode identificar mais facilmente a equipe de profissionais de que ele precisa, assim como estabelecer um modelo efetivo para o desenvolvimento do trabalho. Este Guia contem informaes sobre uma srie de aspectos tcnicos, mas sua maior contribuio espera-se estar na apresentao de questes mais fundamentais e de como elas esto relacionadas.

Fases do planejamento A audincia alvo A identificao da audincia deve ser a sua primeira preocupao, assim como as respostas s perguntas Quem precisa desse trabalho? Quem se beneficiar dele?. Seleo do material As informaes obtidas do levantamento inicial sobre a audincia influenciaro a etapa de seleo dos materiais que sero digitalizados. Nesta fase, voc tambm dever pensar sobre medidas relacionadas a direitos autorais, e sobre como os materiais digitalizados sero distribudos: quais as tecnologias que sero utilizadas, se o acesso aos contedos sero abertos ou controlados, e como voc poder alcanar o seu publico alvo. Estabelecendo padres A utilizao de padres, sempre que possvel, aumenta a longevidade, portabilidade e interoperabilidade do seu contedo. importante que voc conhea os padres que se aplicam ao tipo de digitalizao que voc est pretendendo. Seleo de equipamentos A seleo de equipamentos deve ser tomada considerando a funcionalidade requerida e as suas prioridades. Um exemplo disso poderia ser manter os custos baixos mais importante do que conseguir o melhor padro de captura de imagem. Equipe de trabalho A questo sobre metodologia e procedimentos est intimamente relacionada com a deciso sobre pessoal e, portanto, influenciar as decises acerca de Quem dever fazer o trabalho? Voc dever identificar o perfil dos profissionais necessrios e estabelecer as tarefas que espera que sejam

10

cumpridas. Nessa fase voc poder concluir que precisar de colaboradores externos junto a sua equipe.

Formas gerenciais de produo digital


As imagens digitalizadas podem ser produzidas sob duas condies: Na prpria instituio Nesta categoria enquadram-se as produes realizadas no mesmo ambiente detentor dos documentos a serem digitalizados ou na prpria instituio. Esta modalidade oferece vantagens e desvantagens, conforme pode ser observado abaixo. Vantagens da produo na prpria empresa: Adquirir experincia no processo de digitalizao de imagens (projeto de administrao, familiaridade com a tecnologia, etc.). Controlar o processo de digitalizao de imagem desde a manipulao dos originais at o armazenamento. Ajustar os requerimentos necessrios quanto qualidade, acesso e escaneamento da imagem medida que se progride no processo. Acompanhar diretamente o processo de digitalizao de imagens que melhor satisfaz as necessidades da Empresa e dos usurios. Desvantagens da produo na prpria empresa: Requerer, inicialmente e durante o projeto, um grande investimento financeiro em equipamento e pessoal.

11

Necessitar mais tempo para a implementao do processo, da infraestrutura tcnica, e de gerao de imagens.

Exigir grande investimento para uma produo limitada. Necessitar de especialistas para consultoria, contratos e custos de manuteno,treinamento de pessoal, etc.

Desconhecer padres e prticas melhores.

Terceirizao Caso a Unidade no tenha condies ou no pretenda digitalizar suas imagens in loco, dever considerar as seguintes vantagens e desvantagens na terceirizao da atividade: Vantagens de terceirizar: Pagar pelo custo somente da digitalizao da imagem, no pelo equipamento ou equipe. Alto nvel de produo. Ter especialistas no assunto. Correr menos risco de perdas. Descartar custos relacionados com a obsolescncia da tecnologia, falhas, tempo de inatividade do sistema, necessidade de treinamento de mo-de-obra, etc.

Desvantagens de terceirizar: Menor controle sobre o processo de digitalizao de imagem e controle de qualidade. Necessitar o estabelecimento de contrato complexo, descrevendo todas as especificaes necessrias, direitos e deveres de ambas as partes.

12

Divergncia na comunicao entre vendedor e consumidor, dificultando o estabelecimento de padres de negociao e medio da qualidade do servio.

Necessitar transporte, manuseio e armazenamento dos originais por equipe da empresa de terceirizao.

Possvel inexperincia do prestador de servio com o material da Embrapa.

Audincia alvo
Instituies de pesquisa, como a EMBRAPA, atendem s necessidades de diversas comunidades de usurios de estudantes, acadmicos e pesquisadores, a agricultores, empresrios e do pblico em geral. Ao iniciar o desenvolvimento e planejamento do processo de digitalizao, importantssimo que voc conhea o seu publico alvo. Esta informao influenciar muitas de suas decises, tais como: os itens que sero digitalizados, a tecnologia que ser utilizada, os mecanismos para acesso, e a forma de apresentao do material para os usurios. Por exemplo, voc poder descobrir que tem materiais que interessam tanto a estudantes de agronomia quanto a pequenos produtores agrcolas, mas que cada um desses pblicos requer um tratamento diferenciado da interface de apresentao do material. Neste caso, apesar de voc poder usar a mesma tecnologia para re-formatar o material, e publicar duas verses usando o mesmo sistema, voc dever desenvolver duas interfaces distintas, do mesmo material, para atender aos diferentes usurios. Portanto, as primeiras questes que devero ser respondidas ao iniciar um projeto de digitalizao so: Onde est o publico que dever acessar o meu material? Qual o perfil dessa audincia? 13

O material no formato digital me ajudar a atender melhor as necessidades dessas comunidades de usurios?

A digitalizao de materiais me ajudar a criar novas audincias para os meus materiais?

As demandas e necessidades do pblico alvo As necessidades do pblico da empresa, tambm devem guiar as decises do projeto de digitalizao. Apesar de ser difcil prever como ser o uso do

ambiente eletrnico no futuro, o que se sabe hoje sobre os hbitos dos usurios pode ser usado como referncia. O conhecimento do perfil dos usurios, e suas preferncias para acessar informao podem indicar vrios aspectos a serem atendidos, limitaes e possibilidades de desenvolvimento. Considere as seguintes questes sobre o seu pblico: Qual o tamanho do pblico alvo? Qual a distribuio geogrfica? H necessidade por acesso descentralizado (de diferentes instituies ou de casa)? O seu pblico necessita de ferramentas especiais ou condies especiais para utilizar os recursos digitais? H vrios grupos diferentes de usurios que precisaro de diferentes formas e nveis de acesso? Se voc ainda no tem suficiente informao sobre o seu pblico para responder essas questes, voc precisar de uma estratgia para colet-las e avaliar se os recursos digitais atendem as demandas atuais e futuras desses usurios. A digitalizao tambm pode ser utilizada para trazer novos pblicos e ajudar a expandir contedos especializados para um publico maior. Contedos

14

digitais podem reforar a educao continuada, e ajudar a promover a incluso social e cultural abrindo acesso para grupos menos favorecidos socialmente. O nvel de tecnologia que o pblico alvo utiliza para acessar informao digital tambm deve ser considerado como um fator importante na hora de selecionar os materiais e as metodologias para digitalizao. Se os usurios no tm comprimento de banda suficiente para baixar ou visualizar arquivos grandes como o de imagens, por exemplo, este material corre o risco de no ser disseminado com sucesso. Por outro lado, os seus usurios podem ter uma expectativa de sua empresa que ela ainda no est pronta para corresponder. Voc precisar ento decidir quais so as demandas mais importantes a serem atendidas, e traar estratgias para desenvolv-las.

A seleo de materiais
H uma srie de questes que devem ser consideradas ao decidir sobre o material que dever ser digitalizado, tais como as metas e caractersticas da instituio, o perfil e necessidades dos usurios, e as caractersticas dos prprios materiais. A seguir, algumas questes importantes que devem ser respondidas para a seleo de materiais: Qual o propsito de digitalizar material e quais os critrios que sero utilizados para selecion-los? Quais sero os usurios desses recursos? Quais so suas necessidades? Os materiais selecionados iro requerer cuidados especiais no manuseio?

15

Quais as caractersticas dos materiais e como elas podem afetar o processo de digitalizao?

Caractersticas do material original As colees de documentos, imagens, vdeos, e outros formatos de informao so componentes importantes do capital intelectual de uma empresa como a Embrapa. Um bom programa de digitalizao comea com um levantamento das diversas formas de material da instituio e sua relao com as demandas de seus pblicos. O planejamento para digitalizao dever basear-se nos requerimentos obtidos das anlises dos recursos analgicos e de suas caractersticas fsicas, e no a partir dos recursos tecnolgicos disponveis. A anlise dever incluir uma avaliao do material original, suas condies, caractersticas, e o seu valor educacional, cultural, histrico e cientfico. Questes que devem ser respondidas antes da seleo de material para digitalizao: Qual a relevncia intelectual do material no formato analgico? original? H outro exemplar na instituio em melhores condies? O contedo est completo ou est faltando alguma parte? A informao est atualizada? A informao est correta? O material um interesse efmero dos dias de hoje, ou ele ainda ser de interesse com o passar do tempo?

16

A digitalizao tambm pode aumentar o valor intelectual de seus materiais quando permite novas possibilidades educacionais, como por exemplo: Oferecendo cpias digitais de boa qualidade disponveis para acesso em diferentes instituies, e em diferentes pases; Permitindo o acesso e estudo personalizado do material, com combinaes e justaposies do contedo, de acordo com interesses particulares. Facilitando o acesso a novos pblicos, e permitindo novas formas de explorar e aproveitar o material; Oferecendo a possibilidade de pesquisa e manipulao de textos em formato eletrnico; Oferecendo acesso a diferentes verses e edies, e dando mais flexibilidade e riqueza de utilizao do que seria possvel com um texto de formato impresso; Criando catalogaes eletrnicas que permitem pesquisas rpidas de materiais, em variados formatos de mdia.

Propriedades fsicas dos materiais Apesar da relevncia intelectual dos contedos ser um fator crtico para a seleo dos materiais que sero digitalizados, as caractersticas fsicas desses recursos tambm devero influenciar bastante a sua deciso, uma vez que elas afetam diretamente o produto digital que ser obtido no processo. A seguir, algumas questes que serviro de ponto de partida para gui-lo no processo de examinar os materiais.

17

Propriedades fsicas dos materiais Tipo e categoria do recurso ( um livro impresso, texto escrito a mo, programa de TV em VHS, um original ou uma reproduo?) Data (quantos anos tem? Sabe quando foi feito? ) Tamanho e dimenses fsicas ( um livro de tamanho regular? uniforme? Qual o tamanho em cm? Qual a durao da fita de vdeo em horas/minutos/segundos?) Tipo de mdia (papel, Madeira, couro, vdeo cassete magntico; combinao de materiais?) Formato (disco de 78 rpm, fita cassete analgica, DAT (Digital Audio Tape), Betacam SP tape, NTSC ou PAL formato de vdeo) Estrutura do material (o material encadernado?) Condies de preservao (qual o estado de conservao? Dever ser preservado? Requer manuseio especial?)

Objetivos da digitalizao Alm dos passos j listados (examinar o valor intelectual dos recursos, como isto poder ser melhorado com a digitalizao, e considerar os atributos fsicos dos seus materiais), outros princpios podem ajud-lo a priorizar o processo de seleo. Abaixo, esto as principais razes para justificar uma iniciativa de digitalizao na instituio. Melhorar o acesso; Ajudar na preservao dos materiais originais reduzindo seu manuseio; Facilitar atividades de pesquisa;

18

Atender as necessidades do pblico; Complementar outras iniciativas de digitalizao, de dentro e fora da instituio.

Direitos autorais Assim que voc identificar o material que dever ser digitalizado comece a cuidar dos aspectos relacionados a propriedade intelectual. Se o material que voc quer digitalizar de domnio publico, ou se a empresa possui os direitos autorais e controla os direitos para digitalizao, ento voc provavelmente poder prosseguir sem impedimentos. Se os materiais que voc quer digitalizar no so de domnio pblico, e voc no controla os direitos autorais, ser preciso identificar o detentor desses direitos e solicitar permisso para digitalizar e publicar o material em questo. Mesmo que voc j saiba quem o detentor dos direitos, e mesmo que voc j tenha permisso para uso do material para certos propsitos, voc ainda ter que se certificar que a sua permisso cobre a digitalizao e publicao em meio digital.

Equipamento
O processo de digitalizao exige, antes de sua implementao, a busca de informaes bsicas que orientem a escolha de mquinas e equipamentos diferenciados, que possam atender tanto a tarefa de escanear como a de armazenar, organizar, visualizar e editar informaes. A escolha do equipamento depende, sobretudo, do tipo de material que ser escaneado, assim com a inteno de uso das imagens digitais.

19

Um dos grandes desafios de quem decide realizar um projeto de digitalizao est relacionado com a rapidez com que hardware e software se tornam obsoletos. Portanto, as decises sobre mquinas devem considerar as implicaes que as mudanas tecnolgicas podem ter no ciclo de vida dos materiais digitais. A escolha do equipamento depende, sobretudo, do tipo de material que ser escaneado assim como a inteno de uso das imagens digitais. A seguir, os tens bsicos para a digitalizao de documentos:

Computador muito importante selecionar o tipo adequado de computador para o processo de digitalizao. Os principais componentes que devem ser

considerados para a escolha do computador so: memria, velocidade do processador, o tamanho do espao para armazenagem, e portas de transferncia de dados. Principais componentes para a escolha do computador: Computador com o mximo de memria (RAM) possvel. Quanto mais memria mais capacidade para o computador processar informaes. Computador com processador otimizado para manipulao de imagens. Computador com capacidade para conexes do tipo USB ou IEEE1394. Gravador de CD e DVD.

Monitor Um monitor de alta qualidade, com tela acima de 17 polegadas, alta resoluo, alta velocidade, sem tremulaes e com suporte para vdeo RAM que possa produzir imagens representativas do original digitalizado fundamental para a manipulao e editorao de imagens.

20

Gravador de CD-DVD A aquisio de um gravador de CD-ROM ser necessria quando a Unidade optar pela armazenagem das imagens digitalizadas em CDs. Para salvar as imagens em CD-ROM necessrio que o equipamento adquirido esteja de acordo com as normas ISO e que suporte uma variedade de formatos.

Porta de transferncia de alta velocidade

(USB 2.0 ou Firewire).

Interfaces de transferncias de informao

permitem que o seu computador converse com os perifricos, tais como: scanners, impressoras, cmeras digitais, etc.

Scanners Existem scanners de vrios tipos, tamanhos e nveis de qualidade. A escolha de um scanner depende do objetivo do trabalho, do formato, tipo e tamanho do material que se pretende digitalizar. A seguir, outros fatores que devem ser considerados quando da escolha de um scanner: Resoluo A resoluo o fator determinante na qualidade de um scanner, isto , o nvel mximo de detalhamento que pode ser capturado de uma imagem. A resoluo ptica de um scanner medida pela capacidade de leitura de seu sensor de imagem. Quanto maior a resoluo ptica melhor. Valores acima da resoluo ptica podem ser alcanados por meio de um recurso de software conhecido como interpolao, que gera pontos extra, a partir

21

de amostragens da imagem capturada. Entretanto, existem limites para essa tcnica, que pode produzir imagens com menor nvel de detalhes. Profundidade de cores Trata-se do nmero de cores que cada ponto captado pelo scanner pode ter: preto e branco (1 bit), 256 cores ou escala de cinzas (8 bits), e True Color (24 bits). Quanto maior a profundidade de cores maior a quantidade de informaes capturada pelo scanner, e portanto, maior a similaridade entre a cpia e o original. rea de escaneamento A rea de digitalizao do scanner, normalmente delimitada pela superfcie de vidro do equipamento, costuma variar pouco de um modelo para outro. Em geral todos os scanners so capazes de digitalizar documentos com a largura mxima de uma folha tamanho carta e o comprimento de uma folha formato A4. Tampas removveis facilitam a digitalizao de objetos de grande espessura, como livros e revistas. A capacidade de aceitar acessrios extra, tais como alimentador de folhas avulsas, so oferecidos como opcionais em alguns modelos mais sofisticados. Para escanear slides, diapositivos, negativos ou transparncias, o ideal que se utilize um scanner prprio para esse tipo de material. Tempo de digitalizao Uma caracterstica normalmente associada ao desempenho de um scanner o tempo que o equipamento demora para digitalizar um documento. Isso pode ser influenciado por vrios fatores, entre eles, a resoluo desejada, o nmero de passadas do carro do sensor e as caractersticas do programa de digitalizao.

22

Usabilidade Algumas interfaces so bastante simples, limitando-se a definir cor, resoluo, e rea de digitalizao; outras apresentam interfaces complexas com vrias opes de tratamento de imagem no prprio programa. A complexidade da interface pode transformar a digitalizao num complicado processo de captura e tratamento de imagem, que toma tempo, processamento do computador, e, em muitos casos, a pacincia do usurio.

Cmeras digitais Embora sejam equipamentos que exigem altos investimentos, as cmeras digitais manuais disponveis atualmente no mercado no so boas para escaneamento de grandes arquivos, com exceo das cmeras digitais de alta resoluo (Kontron, Zeutschel, Leica) usadas por grandes instituies e empresas no ramo comercial de imagens. As cmeras digitais de alta resoluo no tm nenhuma limitao para o escaneamento e podem capturar numa resoluo extremamente alta. Porm elas tm requerimentos especficos sobre iluminao, e exigem um alto nvel de habilidade do operador. As vantagens dessas cmeras esto no grande potencial para escanear materiais de tamanho grande, todos os formatos de mdia, materiais encadernados, e o baixo risco na operao com os materiais frgeis. As cmeras digitais no usam filme para capturar imagens. As fotografias so armazenadas numa mdia interna ou em cartes de memria. A capacidade varia de 4MB a 512MB e est aumentando cada vez mais com o progresso da tecnologia. Os cartes de memria guardam um nmero razovel de imagens, dependendo da resoluo escolhida e da capacidade do carto. Se voc utilizar o formato TIFF de imagens, ento os arquivos sero grandes, e logo esgotaro a capacidade do carto. Portanto, voc dever optar por transferir as imagens diretamente para o seu computador, antes de tirar novas fotografias. 23

Software H dois tipos de software necessrios para a digitalizao de imagens. Um deles o software de escaneamento que vem com o scanner; o outro, o software de edio de imagens, normalmente aplicado aps a captura da imagem. Alguns softwares, como o Adobe Photoshop, podem servir tanto como software de escaneamento como de edio de imagem. O software de escaneamento geralmente limitado quanto a

funcionalidade. Deve-se escolher um software de escaneamento que tenha pelo menos a funcionalidade de salvar os arquivos de imagens em formatos padres, tais como TIFF, JPG, GIF etc. Essa funcionalidade ajuda na produo e permite ampla opo de imagens para distribuio em diferentes mdias. Os tipos de software que convertem arquivos de imagens de um formato para outro tambm sero teis. Para produzir imagens com qualidade adequada, importante investir em software de edio de imagens. Normalmente esses software so usados para limpar a imagem, removendo imperfeies, pontos, manchas etc., e para correo, tais como ajuste do nvel de brilho e contraste. Um software de edio de imagem deve ter, entre outras, as seguintes funes: cortar, inclinar, virar, ajustar nvel de brilho e contraste; realar a imagem; controlar o zoom; acomodar diferentes formatos de arquivos; fornecer controle para gama, preto-e-branco e cores (RGB e CMYK); fornecer um histograma; e possibilitar ao usurio criar e salvar situaes customizadas. A escolha do software de edio baseada no nvel de manipulao de imagens desejado e no nvel de especializao dos indivduos que vo utiliz-lo. Alguns softwares de edio de imagens, como o Adobe Photoshop, so muito avanados e podem requerer algum tempo e treinamento para a aprendizagem.

24

Outros softwares mais bsicos permitem somente operaes limitadas, como cortar e girar e, portanto, so de fcil domnio. Alm de considerar a capacidade e a facilidade de uso de um software de edio de imagens, certifique-se de que a tecnologia utilizada suporta o software. Verifique a quantidade de memria, espao em disco rgido, potncia do processador e capacidade de vdeo.

Criao de arquivos digitais


No processo de digitalizao, recomenda-se a criao de trs verses de uma imagem: a imagem mestra, a imagem de acesso e a imagem em miniatura. Dependendo da necessidade de detalhes detectada numa imagem, deve-se criar uma imagem de acesso com uma resoluo mais alta do que a sugerida. Recomendaes gerais Na criao de arquivos mestres devem ser considerados, alm dos requisitos de qualidade, os propsitos de uso. Assegure a qualidade da resoluo, formato dos arquivos, mecanismos de armazenamento e acesso s imagens a partir de uma amostra do material a ser digitalizado. Para garantir melhor qualidade possvel imagem faa a digitalizao a partir dos originais.

Essas recomendaes foram desenvolvidas para: Assegurar nvel elevado de qualidade nas imagens. Facilitar o acesso a imagens digitais.

25

Evitar a duplicao ou o re-trabalho no processo de digitalizao de imagens, diante da evoluo tecnolgica das mquinas e equipamentos.

Os padres apresentados no pretendem ser considerados como verdadeiros, mas guiar a captura, apresentao e armazenamento de imagens, portanto os documentos de caractersticas diferentes das aqui apresentadas devem receber tratamento diferenciado.

Arquivo mestre Trata-se de arquivos de imagens digitais que contm o mximo de atributos das imagens originais. O arquivo mestre deve ser de alta qualidade, visto que preserva o contedo informacional do original, possibilitando variados usos e formatos alternativos para atendimento s vrias demandas, evitando re-trabalho de digitalizao. A cpia mestra no deve ser editada nem compactada. Os arquivos de imagens mestras so muito grandes para serem armazenados on-line. Uma alternativa armazenar esses arquivos em CD ou DVD.

Arquivo de imagens derivadas Arquivos derivados so criados a partir da imagem digital mestra e so usados geralmente para acesso na Web. Arquivos derivados incluem imagens de acesso, dimensionadas para a tela de um monitor mdio, e suas respectivas miniaturas. So geralmente armazenadas on-line.

26

Tabela 1. Caractersticas dos diversos arquivos de imagens.

Tipos de escaneamento

Existem trs tipos de escaneamento: preto-e-branco, em escala de cinzas e colorido. As caractersticas desses 3 tipos so descritas abaixo. Preto-e-branco (Bitonal) Um bit por pixel representando preto-ebranco. O escaneamento bitonal mais apropriado para documentos de alto contraste como textos impressos. Escala de Cinza (Grayscale) Mltiplos bits por pixels representando tons de cinza. A escala de cinza prpria para documentos de tons contnuos, como fotografias em preto-e-branco.

27

Cores (True Colors) Mltiplos bits por pixel representando cores. Escaneamento em cores apropriado para informaes coloridas. documentos com

Esses trs tipos de escaneamento requerem algumas decises subjetivas. Por exemplo, um documento datilografado em preto-e-branco pode ter anotaes em tinta vermelha. Embora o escaneamento bitonal seja freqentemente usado para textos, o escaneamento em cores pode ser preferido neste caso, dependendo de como a imagem ser usada. Manuscritos e documentos impressos antigos podem ter melhor tratamento se escaneados nas cores contnuas da escala de cinza ou cores, para assegurar a reproduo das nuances, as condies do papel e outras marcas nele gravadas.

Digitalizao de documentos As recomendaes tcnicas contidas neste guia foram direcionadas para os seguintes tipos de documentos: Impressos (Texto impresso, fotocpias, documentos datilografados ou impressos a laser que possam conter esboos, ilustraes, manuscritos etc. Podem ser includas nesta categoria as fotografias em preto-ebranco e coloridas). Fotografias (Negativos de filme e transparncias). Mapas Material grfico (Esboos, ilustraes artsticas, litografias, aquarelas etc).

A profundidade de tons ser determinada pela natureza do material escaneado, e pela funcionalidade do scanner utilizado. Os formatos de arquivos sugeridos no so proprietrios e combinam com o padro da indstria.

28

Dependendo do formato do arquivo, podem ocorrer perdas na compactao da imagem. Compactao com baixos nveis de perdas resulta num arquivo similar imagem original; na compactao com perdas, certa quantidade de informao descartada durante o processo. Embora a informao descartada seja invisvel aos olhos humanos, ocorre uma perda de qualidade. As recomendaes sobre resoluo so expressas tanto em dpi (dots per inch pontos por polegada) como em pixel. Nas tabelas a seguir encontram-se resumidas as recomendaes direcionadas para a profundidade de tons, formato de arquivo, compactao e resoluo espacial para cada tipo de documento.
Tabela 2. Recomendaes para texto

29

Nota: Alm dos formatos anteriormente mencionados para texto, pode-se adotar o seguinte formato alternativo. PDF (Portable Document Format) da Adobe um formato de arquivo alternativo para criao e exibio de arquivos de textos na Web. Requer o software Adobe Acrobat para criao e manipulao de arquivos. O download do Adobe Acrobat Viewer grtis e a verso permite aos usurios visualizar os documentos em seus computadores. Para maiores informaes, veja http://www.adobe.com.br
Tabela 3. Recomendaes para Fotografias

Nota: Para produzir imagens escaneadas de alta qualidade recomenda-se o uso do negativo da fotografia. Outra considerao relaciona-se deciso de escanear em preto-ebranco ou cores, as fotografias em spia. Recomenda-se escane-las em cores para criar uma imagem melhor, embora isto aumente muito o tamanho do arquivo.

30

Tabela 4. Recomendaes para Mapas

Tabela 5. Recomendaes para Material grfico

A tabela a seguir resume as informaes sobre imagens mestras, de acesso e miniaturas relacionadas com o tipo de material escaneado.

31

Tabela 6. Recomendaes para digitalizar imagens de diferentes funcionalidades.

32

Controle de qualidade
Deve existir um programa de controle de qualidade em todas as fases do processo de converso digital dos documentos. A inspeo de arquivos de imagens digitais finais deve ser incorporada ao fluxo de trabalho nas propores desejadas de acompanhamento. Recomenda-se que procedimentos de controle de qualidade sejam implementados e

documentados e que sejam definidos claramente os defeitos inaceitveis numa imagem. As imagens devem ser inspecionadas enquanto estiverem sendo visualizadas numa proporo de pixel 1:1 ou numa ampliao de 100%. A qualidade avaliada tanto subjetivamente pela equipe responsvel pelas atividades, atravs da inspeo visual, como objetivamente no software de imagens. O ambiente para inspeo visual de imagens tambm importante: os monitores devem estar ajustados e a sala deve ser escura, ou pelo menos com as luzes apagadas, sem luz do sol ou luz ofuscante. A inspeo visual deve considerar: Imagem com tamanho incorreto Imagem com resoluo incorreta Nome de arquivo incorreto Formato de arquivo incorreto Imagem gravada de modo incorreto (imagem colorida graduada em escala de cinza) Perda de detalhes por causa de superexposio ou sombras Interferncia excessiva especialmente em reas escuras ou sombras No geral muito clara ou muito escura Valores tonais desiguais

33

Falta de nitidez/definio excessiva Presena de artefatos digitais (linhas atravs da figura) Padres de moire (ondulaes ou redemoinhos) Imagem no aparada Imagem de cabea para baixo ou invertida Imagem distorcida ou no centralizada Equilbrio de cores incorreto Imagem fosca ou sem variao de cor Curva negativa na tabela de verificao Recorte de valores em preto-e-branco (em um histograma)

Denominao dos arquivos

necessrio considerar a nomenclatura que ser usada para nomear os arquivos antes de comear o processo de digitalizao. O nome do arquivo deve ser um conjunto de informaes que identifique unicamente aquela imagem. O nome do arquivo deve incluir o nome da coleo ou Unidade assim como o nmero da imagem, mais a extenso apropriada (.gif, .jpg, .tif). Os nomes dos arquivos no devem ter mais de 8 caracteres e no devem incluir espaos ou smbolos tais como ? , /, ou # etc.

34

Armazenagem
Digitalizar recursos requer a criao de uma infra-estrutura significativa para arquivar material digital. Entre outros componentes dessa infra-estrutura deve haver um robusto repositrio digital, um sistema de controle de qualidade e administrao de acessos. Existem vrias opes para armazenagem de material digital, e as mais comuns so: a utilizao de discos rgidos internos, discos ticos, e discos de rede. Discos rgidos internos de computadores so relativamente rpidos e capazes, mas como so diariamente utilizados h sempre o risco de falha, infeco de vrus e outros problemas. preciso estar constantemente providenciando algum tipo de backup em outro formato de armazenagem. Discos ticos (que incluem CD-R e DVD-R) so removveis e de razovel durabilidade, apesar de terem capacidade limitada (640 Mb para CD-R, 6 GB para DVD-R). Cada uma dessas opes ideal para alguns propsitos e inadequada para outros. Portanto, quando decidir por um formato de armazenagem, voc deve considerar primeiramente o tipo de demanda do seu projeto. Se o propsito for backup e preservao essencial que a mdia de armazenagem seja removvel e durvel. Dependendo da quantidade de informao que voc precisa guardar, provvel que tambm seja necessrio uma grande capacidade. Para projetos menores, ou projetos que lidam com pequenos arquivos, a armazenagem em CDROM ou DVD devem ser suficientes.

A Tabela 7 mostra as vantagens e desvantagens dos diversos tipos de mdias de armazenagem.

35

Tabela 7. Tipos de mdia para armazenagem

Se o material destina-se a acesso on-line, h necessidade de adicionar equipamento extra para integrar o meio de armazenagem s redes. Para que uma coleo digital seja acessada via Web, faz-se necessrio os servios de manuteno de rede e suporte, e de uma equipe treinada. O procedimento mais comum para projetos digitais armazenar as imagens mestre off-line em CD-ROMs, e disponibilizar as verses de acesso e as miniaturas on-line 24 horas. Imagens mestras podem ser vistas mediante solicitao, pessoalmente ou por meio de emprstimo de CDs.

36

Metadados e Objetos digitais

Metadado significa informaes sobre os dados, informaes criadas sobre o material e a verso digital, o registro de sua identidade, criao, uso, e estrutura. O propsito do metadado facilitar a pesquisa, o uso, a administrao e reutilizao de material digital. Os metadados podem ser divididos em trs

categorias: descritivos, administrativos e estruturais. Os metadados possibilitam a administrao eficaz do sistema de repositrio dos objetos digitas e ajudam a limitar o acesso propriedade intelectual da instituio. Informaes de catalogao descritiva, facilitam para as pessoas localizarem aquilo que esto pesquisando num repositrio. Porm, cada objeto requer um grande nmero de metadados para ser armazenado. Portanto, catalogar os materiais num repositrio um trabalho intenso. O metadado descritivo descreve e identifica as informaes sobre os recursos digitais, facilitando a busca, acesso e adminitrao do repositrio. As informaes so do tipo bibliogrficas tais como: o criador/autor, ttulo, data da criao, palavras-chave, entre outras. O metadado administrativo usado para facilitar o rastreamento, migrao e reuso dos elementos digitais. As informaes tpicas dessa categoria so: informaes sobre a criao, controle de qualidade, direitos, entre outras. O termo metadado tcnico tambm utilizado para indicar a data de captura da imagem e as caractersticas tcnicas da imagem. O metadado estrutural descreve a estrutura interna do recurso digital e sua relao com suas partes. usado para possibilitar a navegao e a apresentao.

37

ANEXO I FONTES COMPLEMENTARES DE INFORMAO

Escaneamento www.scantips.com/ Um bom site com informaes prticas sobre escaneamento. Especialmente para avaliar caractersitcas de scanners. www.tasi.ac.uk/advice/creating/creating.html Contm revises avanadas sobre scanners e cmeras digitais. www.flatbed-scanner-review.org/ Avalia scanners de alta resoluo em termos de sua habilidade para escanear slides e negativos. www.imaging-resource.com/ Informaes sobre cmeras digitais.

Metadados Adrienne Muir, Copyright and Licensing for Digital Preservation, http://www.cilip.org.uk/update/issues/jun03/article2june.html Dublin Core initiative for administrative metadata http://metadata.net/admin/draft-iannella-admin-01.txt Data Dictionary for Administrative Metadata for Audio, Image, Text, and Video Content to Support the Revision of Extension Schemas for METS http://lcweb.loc.gov/rr/mopic/avprot/extension2.html Dublin Core Metadata Initiative http://dublincore.org/usage/terms/dc/current-elements/ Harvard University Librarys Digital Repository Services (DRS) User Manual for Data Loading, Version 2.04 http://hul.harvard.edu/ois/systems/drs/drs_load_manual.pdf June M. Besek, Copyright Issues Relevant to the Creation of a Digital Archive: A Preliminary Assessment, January 2003 38

http://www.clir.org/pubs/reports/pub112/contents.html Karen Coyle, Rights Expression Languages, A Report to the Library of Congress, February 2004, http://www.loc.gov/standards/Coylereport_final1single.pdf Making of America 2 (MOA2) Digital Object Standard: Metadata, Content, and Encoding http://www.cdlib.org/about/publications/CDLObjectStd-2001.pdf

NARAs Lifecycle Data Requirements Guide (LCDRG), January 2002, http://www.nara-atwork.gov/archives_and_records_mgmt /archives_and_activities/ accessioning_processing_description/ lifecycle/

Official EAD site at the Library of Congress http://lcweb.loc.gov/ead/ Research Library Groups Best Practices Guidelines for EAD http://www.rlg.org/rlgead/eadguides.html

Metadata Encoding and Transmission Standard (METS) rights extension schema http://www.loc.gov/standards/rights/METSRights.xsd Peter B. Hirtle, Archives or Assets? http://techreports.library.cornell.edu:8081/Dienst/UI/1.0/Display/cul.lib/2003-2

Outras fontes de informao Moving Theory into Practice, Cornell University Library, http://www.library.cornell.edu/preservation/tutorial/ HANDBOOK FOR DIGITAL PROJECTS: A Management Tool for Preservation and Access, Northeast Document Conservation Center, http://www.nedcc.org/digital/dighome.htm Guides to Quality in Visual Resource Imaging, Digital Library Federation and Research Libraries Group, July 2000, http://www.rlg.org/visguides Project Management Outlines NDLP Project Planning Checklist, Library of Congress, http://lcweb2.loc.gov/ammem/prjplan.html

39

Considerations for Project Management, by Stephen Chapman, HANDBOOK FOR DIGITAL PROJECTS: A Management Tool for Preservation and Access, Northeast Document Conservation Center, available at http://www.nedcc.org/digital/dighome.htm Planning an Imaging Project, by Linda Serenson Colet, Guides to Quality in Visual Resource Imaging, Digital Library Federation and Research Libraries Group, http://www.rlg.org/visguides/visguide1.html

40

ANEXO II GLOSSRIO
Backup Uma cpia exata de um programa, disco ou arquivo de dados, feita para fins de arquivamento ou para salvaguardar arquivos importantes na eventualidade de que a cpia ativa (original) seja danificada ou destruda. Por esse motivo, o backup tambm chamado de cpia de segurana. Bit A menor unidade de informao processada num computador. CD - Compact disk ou CD-ROM - Compact Disk Read Only Memory - uma forma de armazenamento caracterizada pela alta capacidade e pelo uso de tcnicas ticas de laser para a leitura dos dados. CD-RW CD Rewritable CD regravvel. Compactao Reduo do tamanho de arquivo de imagens. A qualidade das imagens pode ser afetada pelas tcnicas de compactao usadas e o nvel de compactao aplicado. CMYK Cyan Magenta Yellow Black. Estas so as quatro cores bsicas usadas no processo de impresso colorida. Digitalizar Representar ou expressar em forma digital dados no discretos ou contnuos. Downtime Tempo de inatividade, tempo de paralisao. O percentual de tempo em que um sistema de computador ou algum de seus componentes permanece fora de funcionamento. Dpi dots per inch ou ppp pontos por polegada. Expressa o nmero de pontos uma impressora pode imprimir por polegada, ou que um monitor pode mostrar, na horizontal e vertical. Escala de Cinzas - Grayscale Variao de tons de cinza numa imagem. As escalas de cinza de scanners so determinadas pelo nmero de cinzas (valores entre preto-e-branco) que eles podem reconhecer e reproduzir. Escanear Converter uma imagem ou fotografia impressa para a forma digital (mapa de bits) com um scanner ptico. Converter uma imagem tica de uma cmera de vdeo para a forma digital, examinando cada pixel em cada linha do quadro.

41

GIF - Grafic Image File Format Formato de baixa resoluo, adequado para apresentaes em telas. GIF (e JPEG) so os formatos mais usados para imagens em miniatura. O formato GIF reconhecido pela maioria das plataformas, programas de Internet e software de edio de imagens. Hard copy Cpia impressa em papel, filme ou outro meio permanente. Imagem derivada Imagem criada a partir de outra imagem atravs de algum tipo de processo automtico, geralmente com perda de informao. Entre as tcnicas usadas para criar imagens derivadas, esto: criao de exemplar em menor resoluo; uso de tcnicas de compactao com perda de informao; e alterao da imagem com utilizao de tcnicas de processamento. Interferncia Noise Marca no identificvel e que no corresponde ao documento original que surge durante o processo de escaneamento ou transferncia de dados. Intranet Rede projetada para o processamento de informaes em uma empresa ou organizao. JPEG Joint Photographic Experts Group Formato adequado para apresentao impressa e em tela. JPEG reconhecido pela maioria das plataformas de computador, programas de Internet e software de imagens. Links Conectar dois elementos de uma estrutura de dados usando variveis de ndice de ponteiros. Metadado significa informaes sobre os dados, informaes criadas sobre o material e a verso digital, o registro de sua identidade, criao, uso, e estrutura. Moire Distoro ondulada ou oscilao visvel em uma imagem que apresentada ou impressa com uma resoluo inadequada. Off line Programa ou dispositivo computacional que no capaz de se comunicar com um computador ou ser controlado por ele. On-line Programa ou dispositivo de computador que est ativado e pronto para operao, capaz de se comunicar com um computador ou ser controlado por ele. Um ou mais computadores conectados a uma rede. Pixel Termo reduzido de picture element. Cada pixel pode representar um nmero de diferentes tons e cores, dependendo do espao de armazenagem designado para ele. Muitas vezes o termo pixels per inch (ppi) preferido por descrever mais acuradamente a imagem digital.

42

Plug in 1. Pequeno programa que se associa a uma aplicao maior para ampliar sua funcionalidade. 2. Componente de software que se associa ao Netscape Navigator. Scanner Dispositivo ptico de entrada que usa sensores de luz para capturar uma imagem no papel ou algum outro meio. A imagem traduzida em sinais digitais que podem ser processados por softwares de reconhecimento de caracteres pticos (OCR) ou softwares grficos. TIFF - Tagged Image File Format Esse formato permite manter um alto nvel de detalhe da imagem. indicado como formato para os arquivos de imagens mestre. Twain um protocolo padro de comunicao para enviar instrues para hardware (como o scanner) e receber dados de volta ( como a imagem) Website Stio da Web. Zoom Ampliar. A ampliao de uma poro selecionada de uma imagem grfica ou documento de modo que preencha toda a tela. A ampliao um recurso dos programas de desenho geomtrico, processadores de textos e de planilhas que permite ao usurio selecionar uma pequena parte da tela, ampliar a imagem e fazer alteraes na parte ampliada, com uma riqueza maior de detalhes.

43

You might also like