Professional Documents
Culture Documents
E ANLISE DE IMAGENS
ENECA 2005
Curso de Processamento e Anlise de Imagens
Alberto Xavier Pavim Mrio Lucio Roloff
Florianpolis, 12 de Outubro de 2005
Sumrio
1 Introduo 1
2 Processamento e Anlise de Imagens 3
2.1 Terminologia associada Viso . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Fundamentos para o Processamento e Anlise de Imagens . . . . . . . . . . . . . 5
2.2.1 Propriedades das Imagens . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2.2 Pr-Processamento de Imagens (Realce de Caractersticas) . . . . . . . . 8
2.2.3 Morfologia Matemtica . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2.4 Segmentao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3 Aplicaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3 Concluses 30
4 Informaes Gerais 31
i
Lista de Figuras
2.1 Interdependncia entre os termos da rea de sistemas de viso. . . . . . . . . . . 5
2.2 Etapas de formao das imagens em um sistema de viso. . . . . . . . . . . . . . 6
2.3 Amostragem e quantizao dos dados analgicos de uma linha da imagem. . . . 7
2.4 Vizinhanas N
4
(p), N
D
(p) e N
8
(p) do pixel p = 0. . . . . . . . . . . . . . . . . . 8
2.5 Ilustrao de caminhos conectados e regies um uma imagem binria. . . . . . . 8
2.6 Ilustrao do operador T sobre a vizinhana de um ponto da imagem. . . . . . . 9
2.7 Tpicos arranjos de operadores para processamento espacial. . . . . . . . . . . . 10
2.8 Operador 3X3 aplicado sobre a vizinhana de um ponto da imagem. . . . . . . . 11
2.9 Ilustrao de operaes bsicas de pr-processamento. . . . . . . . . . . . . . . 12
2.10 Ilustrao de operaes lgicas e aritmticas de pr-processamento. . . . . . . . 13
2.11 Ilustrao de operaes de ltragem de suavizao e enfatizao. . . . . . . . . . 14
2.12 Representao de uma imagem atravs de seu histograma. . . . . . . . . . . . . 15
2.13 Ilustrao do processo de equalizao do histograma de uma imagem. . . . . . . 16
2.14 Passos realizados no processamento frequencial de imagens. . . . . . . . . . . . 17
2.15 Representao de uma imagem no domnio da frequncia. . . . . . . . . . . . . 18
2.16 Principais formas de elementos estruturantes na morfologia matemtica. . . . . . 19
2.17 Princpio de funcionamento de operadores morfolgicos. . . . . . . . . . . . . . 20
2.18 Diversas conguraes de mscaras para a deteco de descontinuidades. . . . . 21
2.19 Deteco de pontos, linhas e bordas numa imagem. . . . . . . . . . . . . . . . . 22
2.20 Simples ilustrao de tcnicas de deteco de limiares. . . . . . . . . . . . . . . 23
2.21 Processo de segmentao por crescimento de regies. . . . . . . . . . . . . . . . 25
2.22 Processo de segmentao por diviso e agrupamento. . . . . . . . . . . . . . . . 26
2.23 Processo de segmentao por divisores de guas. . . . . . . . . . . . . . . . . . 27
2.24 Diversas reas de aplicao das tecnologias de viso e processamento de imagens. 29
ii
Nomenclatura
DFT Transformada Discreta de Fourier, do ingls Discrete Fourier Transform
IA Inteligncia Articial
OCR Reconhecimento ptico de Caracteres, do ingls, Optical Character Recognition
OCV Vericao ptica de Caracteres, do ingls, Optical Character Verication
iii
Captulo 1
Introduo
Nem todos os animais dependem tanto da viso para sua orientao como os homens. Os
seres humanos so animais que apesar de apresentarem cinco sistemas de sensoreamento viso,
audio, olfato, gustao e tato dependem e conam excessivamente na sua viso, por ser o
sentido que fornece o maior nmero de informaes necessrias para a interpretao do mundo
exterior [2, 19]. Atualmente, uma tecnologia que emula a viso humana encontra-se em avanado
desenvolvimento. Ela visa principalmente atacar problemas onde o ser humano necessite da viso
para tarefas de inspeo, classicao ou monitoramento em geral, que sejam prejudiciais ou
cansativas sade humana, ou extrapole as condies normais da viso humana, como nas tarefas
de medio ptica de preciso.
Algumas aplicaes e alguns tipos de imagens requerem uma interao visual bastante in-
tensa. Acapacidade humana para processar e interpretar imensas quantidades de dados de natureza
visual, motiva o desenvolvimento de tcnicas e dispositivos, de modo a estender ainda mais essa
capacidade e essa sensibilidade. O conhecimento de como reage o sistema visual humano e de
algumas tcnicas disponveis para melhor adequar a imagem aplicao, so importantes para
desenvolver solues computacionais automatizveis. Neste sentido, a rea de Processamento e
Anlise de Imagens permite viabilizar um grande nmero de aplicaes, tanto no domnio do
aprimoramento de informaes picturais para interpretao humana quanto no domnio da anlise
automtica por computador de informaes extradas de uma imagem ou cena.
Entre os seus objetivos principais destacam-se:
O estudo da representao das imagens, que compreende os vrios processos envolvidos na
aquisio, digitalizao, visualizao e caracterizao matemtica de imagens por meio de
transformaes ou modelos, visando o seu processamento eciente em uma etapa posterior.
O processamento de imagens propriamente dito aborda temas variados como realce, ltra-
gem, restaurao, anlise, reconstruo a partir de projees e compresso de imagens.
2
Processamento de Imagens est dentre as tecnologias computacionais que mais cresceram
nos ltimos tempos, sendo estudado por diversas reas do conhecimento, como engenharia, fsica,
medicina, cincia da computao, matemtica, astronomia e outras.
Este mini-curso ir introduzir mtodos bsicos e aplicaes de processamento digital de
imagens. O curso ser de quatro horas onde pretende-se abordar basicamente os seguintes tpicos:
1. Discusso sobre a terminologia na rea de viso.
2. Propriedades de imagens: representao, amostragem e quantizao.
3. Processamento de imagens no domnio espacial.
4. Processamento de imagens por morfologia matemtica.
5. Segmentao de imagens.
6. Aplicaes, exemplos e estudo de caso.
O acadmico ter melhor aproveitamento caso tenha um bom embasamento matemtico e
conhecimento de alguma linguagem de programao. Boa parte das informaes contidas neste
documento foram retiradas da referncia Pavim [16], a qual pode ser baixada a partir do stio do
grupo S2i
1
na internet.
1
http://s2i.das.ufsc.br/downloads/
Captulo 2
Processamento e Anlise de Imagens
Otermo processamento de imagens frequentemente confundido comoutros termos da rea
de viso. Este documento pretende iniciar uma breve discusso quanto terminologia associada
rea de viso e seguir apresentando os fundamentos da rea de processamento de imagens. Por
m so apresentadas diversas aplicaes da rea de viso.
2.1 Terminologia associada Viso
Quando nos referimos ao termo viso, mais especicamente viso de mquina (do in-
gls machine vision) ou tambm sistemas de viso, surgem uma srie de novos termos levemente
interligados, relacionados com a rea de processamento de imagens, cada qual com sua prpria
denio, mas que causamconfuso pela anidade de conceitos. No h umconsenso geral na lite-
ratura desta rea para a denio precisa desta terminologia, porm, adotaremos aqui os conceitos
apresentados por Gonzalez and Woods [6], Jain et al. [7] e Erhardt-Ferron [4], por apresentarem
certa semelhana:
Processamento de Imagens: refere-se ao processamento digital de imagens atravs de um com-
putador ou dispositivo eletrnico, onde as entradas e sadas do processamento so imagens.
Em geral so operaes de realce, restaurao, transformao ou compresso de imagens.
Enquadra-se este tipo de operao de processamento como de baixo ou at mdio nvel.
Um exemplo seria a aplicao de um ltro na imagem para realar as bordas de seus objetos.
Viso Computacional: refere-se ao processamento digital de imagens para a extrao de carac-
tersticas importantes, que auxiliem na compreenso da imagem e na tomada de decises
inteligentes. Enquadra-se este tipo de operao de processamento como de alto nvel,
sendo comum a utilizao de tcnicas de inteligncia articial para o processamento dos
dados. Um exemplo seria o reconhecimento e a classicao de um objeto da imagem.
2.1. Terminologia associada Viso 4
Anlise de Imagens: refere-se ao processamento digital de imagens onde somente as entradas do
processamento so imagens. As sadas costumam apresentar uma descrio ou represen-
tao diferente da imagem ou alguma caracterstica sua. Diz-se que a anlise de imagens
encontra-se em nvel intermedirio ao processamento de imagens e viso computacional,
enquadrando-se como operaes de mdio nvel, podendo at atingir operaes de alto
nvel. Um exemplo seria a visualizao dos dados de uma imagem a partir de seu histo-
grama, que descreve as caractersticas de luminosidade da cena ali representada.
Computao Grca: refere-se ao processo de formao de imagens a partir de um modelo de
primitivas geomtricas, como linhas e crculos, aplicado nas reas de publicidade, jogos ele-
trnicos, realidade virtual, dentre outras. A computao grca caminha no sentido inverso
da viso computacional, que pretende analisar e compreender imagens do mundo real, e no
cri-las. Porm, existe uma certa ligao destas reas, principalmente no que diz respeito s
pesquisas de realidade virtual ou de gerao de modelos 3D a partir de imagens de tomogra-
a mdica, onde ferramentas de ambas as reas so utilizadas para a gerao e apresentao
de resultados.
Reconhecimento de Padres: refere-se a operaes inteligentes na interpretao de sinais. Est
intimamente ligado viso computacional, mas no necessariamente processa apenas infor-
maes visuais para realizar o reconhecimento de caractersticas de um ambiente, pelo fato
de existiremoutros tipos de sensores dos quais poderia fazer uso, como por exemplo um sen-
sor acstico para reconhecimento de voz. Em viso computacional, trata-se da interpretao
e reconhecimento de objetos e caractersticas especcas em uma imagem.
Inteligncia Articial: refere-se modelagem de sistemas inteligentes e anlise de aspectos li-
gados inteligncia. normalmente usada junto viso computacional para a obteno,
reconhecimento e classicao de objetos e caractersticas nas imagens. Em geral aplicada
em trs etapas: percepo, cognio e ao. A etapa de percepo traduz os sinais proveni-
entes do ambiente em smbolos, a de cognio manipula estes smbolos e a de ao traduz o
resultado destes smbolos em aes que devem ser aplicadas de volta ao ambiente. O campo
de viso computacional considerado por alguns autores como sendo uma sub-rea de IA.
Sistemas de Viso: refere-se a um sistema completo, que envolve a soluo de um problema de
natureza visual, tentando criar um modelo do mundo real a partir de suas imagens. com-
posto tanto por dispositivos de hardware como por mdulos de software, fazendo uso de
uma ou at todas as demais operaes de processamento previamente citadas. Em geral,
etapas como aquisio de imagens, pr- e processamento das imagens, extrao de carac-
tersticas, tomada de deciso inteligente e atuao/realimentao esto contempladas num
sistema deste tipo.
2.2. Fundamentos para o Processamento e Anlise de Imagens 5
Figura 2.1: Interdependncia entre os termos da rea de sistemas de viso.
Fonte: Atualizada a partir de Deschamps [3].
Viso de Mquina: refere-se ao termo ingls machine vision. usado normalmente como um
sinnimo para o termo sistema de viso, porm, pode ser encontrado na literatura como
sendo a simulao e/ou incorporao do comportamento visual inteligente de humanos em
mquinas, como robs, usando extensivamente tcnicas de viso computacional e intelign-
cia articial.
A gura 2.1 a seguir ilustra a ntima ligao entre os termos e reas acima mencionados.
2.2 Fundamentos para o Processamento e Anlise de Imagens
Nesta seo apresenta-se um embasamento dos principais algoritmos e tcnicas de proces-
samento e anlise de imagens.
2.2.1 Propriedades das Imagens
As imagens digitais que so armazenadas na memria de um computador podem ser consi-
deradas funes bi-dimensionais da forma f (x, y), onde o valor de amplitude de f na coordenada
espacial (x, y) da imagem um valor inteiro no-negativo, representando o nvel de intensidade
luminosa proveniente da cena observada e registrado no sensor ptico naquele ponto [6, 23]. As
imagens geradas a partir de um processo fsico, possuem valores de f dentro de uma faixa nita e
proporcional intensidade luminosa incidente no sensor:
0 < f (x, y) < (2.1)
sendo que f pode ser interpretada como uma combinao de duas componentes: (1) a quantidade
de luz proveniente da fonte luminosa da cena e (2) a quantidade de luz reetida pelos objetos da
cena, chamados de iluminao i(x, y) e reectncia r(x, y), respectivamente:
f (x, y) = i(x, y)r(x, y) (2.2)
2.2. Fundamentos para o Processamento e Anlise de Imagens 6
Figura 2.2: Etapas de formao das imagens em um sistema de viso.
Fonte: Jhne et al. [9].
onde
0 < i(x, y) < (2.3)
e
0 < r(x, y) < 1. (2.4)
A equao 2.4 indica que a reectncia sempre limitada total absoro da luz pelos
objetos (r = 0) ou total reexo dos raios luminosos (r = 1). A natureza de i(x, y) depende da
fonte luminosa, enquanto r(x, y) depende das caractersticas superciais dos objetos observados
[6, 7].
Toda imagem captada pelo sensor ptico passa por um estgio de digitalizao do sinal, para
que possa ser compreendida pelo elemento processador do sistema (gura 2.2). Deste processo
de digitalizao da imagem, destacam-se duas tarefas muito importantes realizadas pelo conversor
analgico-digital: a amostragem e a quantizao do sinal [6, 9, 23].
A amostragem consiste em pegar amostras de pontos da informao contnua e analgica
do sinal do sensor ptico em distncias equidistantes ao longo dos eixos vertical e horizontal da
imagem, enquanto que a quantizao extrai os valores de intensidade luminosa identicados nestes
pontos amostrados. O processo de amostragem e quantizao de uma imagem est intimamente li-
gado resoluo da imagem produzida. Nota-se que quanto maior o nmero de pontos amostrados
na imagem, maior ser a resoluo espacial desta. Da mesma forma, quanto maior o nmero de
nveis de intensidade luminosa considerados na imagem para representar a tonalidade de um ponto
amostrado, maior ser a resoluo de tonalidades da imagem. A gura 2.3 ilustra a amostragem e
quantizao de um sinal analgico para transform-lo em um sinal digital.
Desta forma, ca fcil enxergar a organizao de uma imagem de acordo com uma estrutura
matricial, onde o nmero de elementos (pontos ou pixels) das linhas e colunas da matriz (imagem)
determinado pela amostragem do sinal, e o valor numrico dos elementos extrado da quan-
tizao da intensidade luminosa incidente em cada ponto amostrado da matriz no sensor ptico
[6, 9, 23].
2.2. Fundamentos para o Processamento e Anlise de Imagens 7
Aquisio de uma linha contnua da imagem Amostragem e quantizao da linha
Figura 2.3: Amostragem e quantizao dos dados analgicos de uma linha da imagem.
Uma imagem com M linhas e N colunas possui em seu ponto de origem um valor de inten-
sidade luminosa correspondente a f (0, 0) e no seu ponto nal f (M1, N1). Os demais pontos
intermedirios esto dispostos segundo a estrutura matricial da equao 2.5:
f (x, y) =
(2.5)
Nota-se que diversas operaes matemticas aplicadas a matrizes podem tambm ser utili-
zadas na rea de processamento de imagens. Para prosseguir com um estudo mais aprofundado
sobre estas operaes, desejvel ainda introduzir algumas propriedades e relacionamentos entre
os elementos ou pixels internos de uma imagem: vizinhana, adjacncia, conectividade, regio e
limite [6].
Um pixel p nas coordenadas (x, y) de uma imagem possui 4 vizinhos horizontais e verticais
nas seguintes coordenadas: (x +1, y), (x 1, y), (x, y +1), (x, y 1). O conjunto destes pixels
vizinhos denota-se N
4
(p). Neste conjunto, todos os pixels vizinhos de p encontram-se a uma
unidade de distncia de (x, y). J os outros 4 vizinhos diagonais de p encontram-se nas coorde-
nadas: (x +1, y +1), (x +1, y 1), (x 1, y +1), (x 1, y 1), sendo que o cojunto destes pixels
vizinhos denota-se N
D
(p). Este conjunto, juntamente com N
4
(p) forma um novo conjunto deno-
minado N
8
(p), que engloba todos os pixels vizinhos de p. H a possibilidade de algum destes
pixels vizinhos permanecerem fora dos limites da imagem, caso p encontre-se em uma de suas
bordas. A gura 2.4 ilustra as vizinhanas (representadas por 1) N
4
(p), N
D
(p) e N
8
(p) para um
dado pixel p = 0.
A partir do conceito de vizinhana, dene-se a adjacncia. Diz-se que o pixel q adjacente
de p quando q encontra-se na vizinhana de p e satisfaz ainda uma condio de semelhana
2.2. Fundamentos para o Processamento e Anlise de Imagens 8
1
1 0 1
1
1 1
0
1 1
1 1 1
1 0 1
1 1 1
N
4
(p) N
D
(p) N
8
(p)
Figura 2.4: Vizinhanas N
4
(p), N
D
(p) e N
8
(p) do pixel p = 0.
0 0 1 1 0
S p
1
q
1
1 0 0
0 1 1 0 1
0 1 0 0 p
3
R
p
2
q
2
0 0 q
3
Figura 2.5: Ilustrao de caminhos conectados e regies um uma imagem binria.
ou anidade de intensidade luminosa. Ou seja, alm de ser vizinho, deve possuir um valor de
intensidade dentro de uma faixa especca de tons, a denir.
Dado um conjunto de pixels S numa imagem, dois pixels, p na coordenada (x, y), e q na
coordenada (t, u), sero conexos quando entre eles houver um caminho de pixels adjacentes
ligando-os, todos pertencentes ao conjunto S. De forma semelhante, um conjunto de pixels R
numa imagem s poder ser considerado uma regio da imagem caso todos seus pixels sejam
conexos, e formem um conjunto completo conectado. Para nalizar, dene-se o limite L de uma
regio R como sendo o conjunto de pixels de R que possuem um ou mais vizinhos no-pertencentes
R.
Na gura 2.5 podemos avaliar os conceitos cima denidos. Nota-se que para o conjunto S,
existe uma conexo entre os pontos p
1
e p
2
caso ambos tenham valor 0, assim como para q
1
e q
2
caso ambos tenham valor 1. J para o conjunto R, podemos declar-lo como uma regio caso os
pontos p
3
e q
3
tenham valor 0, concretizando a conexo completa de todos os pontos do conjunto.
Mais informaes sobre propriedades das imagens em [2, 5, 6, 7, 8, 17, 18, 22, 23].
2.2.2 Pr-Processamento de Imagens (Realce de Caractersticas)
Operaes de pr-processamento so aplicadas em uma imagem para alcanar como resul-
tado outra imagem com caractersticas realadas, mais adequadas para prosseguir com as demais
etapas de processamentos necessrias [6]. Existem inmeras tcnicas de realce de imagens. Den-
tre as mais conhecidas esto as de ltragem nos domnios espacial e frequencial, conforme ser
visto nas sub-sees seguintes.
2.2. Fundamentos para o Processamento e Anlise de Imagens 9
Figura 2.6: Ilustrao do operador T sobre a vizinhana de um ponto da imagem.
Fonte: Gonzalez and Woods [6].
Estas tcnicas de pr-processamento enquadram-se entre as tcnicas de baixo nvel (con-
forme levantado na seo 2.1), recebendo imagens na entrada e resultando em imagens tambm
na sada. O estudo destas tcnicas fundamental inclusive para a compreenso de muitas outras
tcnicas de processamento de imagens, que baseiam-se nestes conceitos para gerao de novas
solues no processamento das imagens. As informaes contidas nesta sub-seo baseiam-se
principalmente em [6] e podem ser encontradas mais aprofundadas em [2, 5, 7, 10, 14, 17, 18, 19,
20, 21, 22, 23].
Pr-Processamento no Domnio Espacial
O processamento no domnio espacial refere-se a procedimentos que operam diretamente
sobre os pixels de uma imagem, na forma como esto arranjados espacialmente. Uma operao de
processamento espacial denotada da seguinte forma:
g(x, y) = T[ f (x, y)] (2.6)
onde f (x, y) representa a imagem de entrada, g(x, y) representa a imagem de sada realada, e T
um operador em f , denido para atuar sobre a vizinhana do ponto (x, y). A ilustrao deste
procedimento pode ser vista na gura 2.6.
O operador T pode atuar em diferentes tamanhos de vizinhana no ponto (x, y), porm, o
mais comum que esta apresente um formato circular, quadrangular ou retangular, centrado sobre
o ponto (x, y). Tpicos arranjos de operadores quadrangulares podem ser vistos na gura 2.7.
Da gura vemos que a menor e mais simples vizinhana em torno do ponto (x, y) o prprio
ponto (operador 1X1). Quando T tem este tamanho de vizinhana ele chamado de funo de
2.2. Fundamentos para o Processamento e Anlise de Imagens 10
w
1
w
1
w
2
w
3
w
4
w
5
w
6
w
7
w
8
w
9
w
1
w
2
w
3
w
4
w
5
w
6
w
7
w
8
w
9
w
10
w
11
w
12
w
13
w
14
w
15
w
16
w
17
w
18
w
19
w
20
w
21
w
22
w
23
w
24
w
25
w
1
w
2
w
3
w
4
w
5
w
6
w
7
w
8
w
9
w
10
w
11
w
12
w
13
w
14
w
15
w
16
w
17
w
18
w
19
w
20
w
21
w
22
w
23
w
24
w
25
w
26
w
27
w
28
w
29
w
30
w
31
w
32
w
33
w
34
w
35
w
36
w
37
w
38
w
39
w
40
w
41
w
42
w
43
w
44
w
45
w
46
w
47
w
48
w
49
1X1 3X3 5X5 7X7
Figura 2.7: Tpicos arranjos de operadores para processamento espacial.
transformao de intensidade, pois opera diretamente no valor de intensidade do ponto (x, y)
da imagem f , gerando um novo valor de intensidade para o mesmo ponto na imagem g. Caso
este operador passasse por toda a rea da imagem f somando a cada ponto um certo nvel de
intensidade luminosa, geraria uma imagem g mais clara. Estas operaes de vizinhana unitria
so tambm conhecidas como processamento pontual.
J as demais conguraes de operadores (3X3, 5X5, 7X7) so utilizadas especialmente
em operaes de ltragem de imagens, e so mais conhecidas na literatura de processamento de
imagens como mscaras, kernels ou ltros de convoluo. Uma operao de ltragem linear para
uma mscara de tamanho 3X3 poderia ser denida da seguinte forma:
R = w(1, 1) f (x 1, y 1) +w(1, 0) f (x 1, y) + +
w(0, 0) f (x, y) + +w(1, 0) f (x +1, y) +w(1, 1) f (x +1, y +1),
onde R o resultado da operao linear aplicada sobre o ponto (x, y) e sua vizinhana na imagem
f , gerando o valor de intensidade luminosa para apenas um ponto (de coordenadas (x, y)) na
imagem g. A operao ilustrada na gura 2.8. Desta forma, cada ponto da imagem g gerado
levando-se em conta uma operao linear aplicada a nove pontos da imagem f . A nova e completa
imagem g formada ao aplicar-se o operador cima citado sobre toda a regio da imagem f , ou
seja, movendo a mscara de ltragem sobre os pontos da imagem, de maneira semelhante ao que
ocorre em operaes de convoluo de sinais unidimensionais.
Das operaes de processamento pontual ou por mscara de convoluo, surgem uma srie
de operaes bsicas, lgicas, aritmticas e de ltragem para aplicao em domnio espacial nas
imagens. Dentre as operaes bsicas, baseando-se em operaes de processamento pontual, as
mais comumente empregadas podem ser vistas na gura 2.9, seguindo uma sucinta descrio:
Identidade: nada mais do que uma cpia idntica, ponto a ponto da imagem original.
Negativa: a negativa de uma imagem f obtida ao inverter-se a intensidade luminosa de todos
os pontos da imagem, resultando em uma nova imagem g com aspecto semelhante a um
2.2. Fundamentos para o Processamento e Anlise de Imagens 11
Figura 2.8: Operador 3X3 aplicado sobre a vizinhana de um ponto da imagem.
Fonte: Gonzalez and Woods [6].
negativo fotogrco. Ou seja, para uma imagem f com uma faixa de tons de cinza variando
de [0, L1], a negativa desta imagem obtida pela expresso: g(x, y) = (L1) f (x, y).
Esta operao adequada para destacar pequenos detalhes brancos ou cinza sobre grandes
reas negras.
Logartmica: esta operao aplica uma transformao logartmica cada ponto de uma imagem
f , conforme a expresso: g(x, y) = clog(1+ f (x, y)), onde c uma constante a ser denida.
Esta operao normalmente mapeia uma faixa de baixos valores de intensidade luminosa
para faixas maiores, tornando visveis partes da imagem que encontravam-se muito escuras.
Potncia: esta operao aplica uma transformao de potncia cada ponto de uma imagem f ,
conforme a expresso: g(x, y) = c( f (x, y) +)
1 if f (x, y) > T
0 if f (x, y) T
(2.8)
Assim, pontos da imagem rotulados com o valor 1 representam objetos da imagem, e pon-
tos rotulados com o valor 0 representam o fundo da imagem. Quando a expresso de T depende
2.2. Fundamentos para o Processamento e Anlise de Imagens 24
apenas de f (x, y) (nvel de intensidade luminosa), diz-se que a operao corresponde a uma limi-
arizao global. Se T depende tambm de p(x, y), este chamado de limiarizao local. Caso
T ainda dependa das coordenadas espaciais x e y, alm de f e p, este chamado de limiarizao
dinmica ou adaptativa [6]. Cada um destes tipos de limiarizao possuem uma abordagem e
implementao levemente diferente, porm, no sero detalhados mais a fundo neste trabalho.
Segmentao Baseada em Regies
Este tipo de segmentao divide a imagem procurando por regies que atendam a algum
tipo de similaridade. Em geral, uma imagem segmentada formada por um nmero n de regies
de pontos na imagem (como visto na sub-seo 2.2.1), sendo que a unio destas regies compe a
imagem completa. As regies devemsempre ser disjuntas e atender a um determinado critrio para
o agrupamento de seus pontos. Duas tcnicas so bem conhecidas: segmentao por crescimento
de regies (region growing) e por diviso e agrupamento de regies (split and merge).
A segmentao por crescimento de regies um procedimento que agrupa pontos e pe-
quenas sub-regies da imagem em maiores regies, de acordo com um critrio de semelhana
pr-denido. Em geral, parte-se de um conjunto de pontos ditos sementes, e a partir destes
pontos inicia-se um processo de crescimento de regies, agrupando todos os pontos vizinhos que
respeitem o critrio de semelhana com a semente. comum que para cada aplicao tenha-se
uma ligeira noo de que pontos serviriam como boas sementes para o incio do algoritmo (nor-
malmente faixas especcas de intensidade luminosa na imagem).
A escolha pelo critrio de similaridade entre os pontos varia conforme a aplicao e o tipo
de imagem sendo usada. Dentre os critrios mais utilizados destacam-se a intensidade luminosa, a
textura, e a cor dos pontos. Alguns outros critrios fornecem ao algoritmo uma certa inteligncia
para a reunio dos pontos, como analisar as propriedades de adjacncia e conectividade dos mes-
mos enquanto forma-se a regio. Critrios para a parada do algoritmo costumam ser o tamanho e
a forma das regies formadas, assim como a similaridade de caractersticas de novos pontos para
adentrar uma determinada regio. A segmentao por cresciemento de regies ilustrado na gura
2.21.
J a segmentao por diviso e agrupamento aborda uma soluo diferente para classi-
car e agrupar regies da imagem. A idia consiste em iniciar uma srie de divises sistemticas a
partir da imagem original, at alcanar inmeras divises distintas que realmente formem regies
na imagem. Ou seja, nestas divises todos os pontos devem obedecer a um critrio de simila-
ridade para poderem manter-se agrupados. A estrutura de dados mais utilizada para representar
as divises na imagem so as rvores do tipo quadtree, que divide sempre a imagem em quatro
partes iguais. Aps uma diviso, caso a condio de similaridade no se verique para todas as
2.2. Fundamentos para o Processamento e Anlise de Imagens 25
Imagem Original Imagem Segmentada
Figura 2.21: Processo de segmentao por crescimento de regies.
Fonte: http://www.comp.leeds.ac.uk/ai21/examples/images/rgrow.html
partes separadas, cada parte prossegue sendo dividida obedecendo esta mesma estrutura at atingir
diversas regies, que reunidas formam a imagem completa.
Quando no h mais possibilidade de realizar divises, ou seja, todas as divises j formam
regies distintas, inicia-se o processo de agrupamento das regies vizinhas que atendam ao mesmo
critrio de similaridade de agrupamento dos pontos, para realmente formar um grupo de regies
maiores que caracterizem de maneira mais visvel as diferentes informaes da imagem. O proce-
dimento termina quando no mais possvel agrupar nenhuma regio da imagem. O processo de
segmentao por diviso e agrupamento ilustrado na gura 2.22.
Segmentao por Divisores de gua (Watersheds)
A segmentao por divisores de gua abrange conceitos de todas as demais tcnicas de seg-
mentao para realizar a diviso da imagem em partes distintas. O nome dado tcnica provm do
seu princpio de funcionamento, que consiste em visualizar qualquer imagem em uma representa-
o tri-dimensional da mesma, considerando as coordenadas espaciais x e y nos planos horizontal
e vertical, respectivamente, e ainda o nvel de intensidade luminosa dos pontos nestas coordenadas
no plano perpendicular aos demais, provendo a idia de profundidade na imagem.
De acordo com esta representao topogrca da imagem, consideram-se trs elementos:
(a) pontos da imagem que pertenam a um mnimo local, (b) pontos intermedirios, em que se
colocada uma gota dgua sobre o ponto, esta escorreria em direo de um mnimo local, e (c)
pontos que pertenam a mximos locais, nos quais, se colocada uma gota dgua sobre o ponto,
a gota teria a possibilidade de escorrer para mais de um mnimo local. Os pontos que satisfa-
zem a condio (b) na imagem so chamados de represa ou divisores de guas. J os pontos que
2.2. Fundamentos para o Processamento e Anlise de Imagens 26
Imagem Original Processo de Diviso da Imagem
Imagem Segmentada Estrutura de armazenamento Quadtree
Figura 2.22: Processo de segmentao por diviso e agrupamento.
satisfazem a condio (c) so chamados de linhas divisrias de guas, e o algoritmo est interes-
sado justamente em encontrar estas linhas divisrias, pois elas limitam e representam as bordas de
objetos na imagem.
O algoritmo funciona da seguinte maneira: primeiramente, supe-se que junto aos pontos
de mnimo local (em geral pontos de baixa intensidade luminosa) abrem-se tubulaes para que
gua possa adentrar em uma taxa constante. Enquanto a gua no atinge algum ponto de mximo
local, ou seja, no consegue escape e no vasa para outra regio, ela continua entrando e cobrindo
a regio, sendo limitada pelos pontos divisores de gua. No momento em que algum ponto de
mximo local alcanado e a gua esta prxima de vazar e unir duas regies distintas, construdo
uma barragem para impedir esta unio. Haver um momento em que em todos os pontos de
mximo local ser construda esta barragem, e apenas o topo desta barragem mantm-se visvel
junto s guas. Neste momento o algoritmo para, pois estes pontos que correspondem barragem
so as linhas divisrias de guas, que representam as bordas dos objetos na imagem.
O processo de diviso de guas ilustrado na gura 2.23. Em geral este algoritmo apli-
cado para a extrao e separao de objetos de caractersticas ligeiramente uniformes do fundo da
2.3. Aplicaes 27
Imagem Original Levantamento da represa Linhas Divisrias de guas
Figura 2.23: Processo de segmentao por divisores de guas.
Fonte: http://www.reindeergraphics.com/tutorial/chap6/binary04.html
imagem. muito comum inclusive aplicar este tipo de algoritmo ao gradiente das imagens, ao
invs delas prprias, pois isto facilita a identicao de regies de baixos valores de gradiente.
2.3 Aplicaes
As reas de sistemas de viso e processamento de imagens so muito extensas e baseiam-se
em diversas reas do conhecimento, o que lhes garante grande exibilidade de solues e aplica-
es em diferentes meios. Inmeras reas de aplicao podem ser mencionadas [2, 11, 15, 20, 22]:
Controle de Qualidade: rgido monitoramento sobre caractersticas particulares de produtos in-
dustriais, procurando evitar o contato de produtos defeituosos com o mercado consumidor.
Exemplos: vericao de nmeros de lote, lacres, rtulos, referncias e datas de validade
em embalagens, inspeo de placas de circuitos impressos, inspeo de ampolas e compri-
midos.
Controle de Processos Industriais: manipulao de peas emlinhas industriais e monitoramento
de parmetros fundamentais para o bom desempenho de processos industriais, visando rea-
limentar o sistema corrigindo estes parmetros quando necessrio. Exemplos: alinhamento
de peas em linhas automotivas, orientao de robs de solda, pintura ou manipuladores,
monitoramento de parmetros de corte em processos de usinagem.
Rastreabilidade: localizao e reconhecimento de informaes codicadas sobre a superfcie de
produtos. Exemplos: leitura de cdigos de barras, localizao e leitura de cdigos bidimen-
sionais em linhas de montagem, identicao de toras na indstria madeireira.
Segurana: certicao de permisses e monitoramento de ambientes. Exemplos: inspeo de
bagagens por raios-X, reconhecimento de ris e impresses digitais, leitura de placas de
automveis, monitoramento inteligente de ambientes por deteco de movimento.
2.3. Aplicaes 28
Geograa e Metereologia: anlise de imagens de satlite. Exemplos: previses meteorolgi-
cas e fenmenos naturais, inspeo de reas de preservao ambiental, medies de reas
territoriais.
Astronomia: anlise de imagens espaciais. Exemplos: anlise da composio fsica de estrelas,
cometas e planetas, criao do modelo de constelaes e galxias.
Militar: inspeo de ambientes em condies desfavorveis ao olho humano. Exemplos: mdu-
los pticos de visualizao noturna baseados em imagens de calor.
Controle de Trfego: anlise e controle de trfego rodovirio para manter um uxo normal de
automveis. Exemplos: controle de redes de semforos e criao de desvios inteligentes e
informaes de alerta em autovias atravs da anlise do uxo automotivo.
Anlise de Imagens Mdicas: auxlio na identicao de diagnsticos e doenas. Exemplos:
tomograa cerebral, inspeo da estrutura ssea por raios-X, controle do crescimento e
sade de bebs, sondas para anlise internas de rgos do corpo humano.
Escritrio e Lazer: dispositivos e sistemas para ampliar a comunicao e armazenamento de in-
formaes. Exemplos: videoconferncias, escaneamento de imagens e textos (OCR/OCV),
controle de sistemas computacionais para decientes fsicos.
A gura 2.24 ilustra exemplos de aplicao em cada uma das reas previamente citadas.
2.3. Aplicaes 29
Controle de Qualidade Controle de Processo Industrial Rastreabilidade
Controle de Trfego Inspeo de reas Geogrcas Astronomia
Militar: Viso Noturna Segurana de Ambientes Escritrio e Lazer
Imagens Mdicas Reconhecimento de Digitais Previses Metereolgicas
Figura 2.24: Diversas reas de aplicao das tecnologias de viso e processamento de imagens.
Captulo 3
Concluses
Neste mini-curso apresentou-se uma breve viso sobre algumas tcnicas de processamento
e anlise de imagens, que envolvem distintas reas de pesquisa e aplicao, no sendo possvel
neste mini-curso esgotar a discusso.
A maioria das disciplinas de graduao, seja em engenharia, cincias da computao ou
cincias exatas, aborda o tpico de processamento de imagens em uma disciplina de fundamentos
e outra de tcnicas avanadas. E como observou-se neste mini-curso, a temtica de processamento
de imagens faz parte tambm dos estudos nas reas de viso computacional e sistemas de viso.
Discutiu-se aqui uma introduo ao tema de processamento e anlise de imagens, funda-
mentos, conceitos e terminologia, seguido de uma breve descrio das etapas de processamento
na primeira parte do mini-curso. Em um segundo momento destacou-se alguns fundamentos do
processamento de imagens no domnio espacial, morfologia matemtica e segmentao. Por m,
uma srie de aplicaes usando viso e processamento de imagens foram apresentadas, demons-
trando a importncia e crescimento das pesquisas recentes nestas reas. H um grande potencial
de aplicao da tecnologia de viso articial nas reas de medicina (ecocardigramas, radiograas,
ultra-sonograas), meteorologia (imagens de satlite, imagens de radar), ferramentas de multi-
mdia, internet, controle de qualidade, metrologia, dentre outras, que evidenciam uma curva de
desenvolvimento crescente neste mbito.
Este mini-curso traz como contribuio para os participantes uma oportunidade de ampliar
seu conhecimento na rea de viso e como ela pode ser aplicada em sistemas de automao de pro-
cessos. A literatura desta rea riqussima e recomenda-se aos interessados realizar uma pesquisa
bibliogrca mais profunda, iniciando pelas obras referenciadas ao m deste documento.
Captulo 4
Informaes Gerais
Maiores informaes, exemplos prticos, ferramentas e tcnicas na rea de sistemas de
viso podem ser encontradas nas referncias bibliogrcas deste documento e no prprio stio do
grupo S2i
1
Sistemas Industriais Inteligentes do Departamento de Automao e Sistemas da
Universidade Federal de Santa Catarina.
Outras fontes de informao so alguns stios especializados na rea de processamento de
imagens, como por exemplo:
http://www.imageprocessingplace.com/
http://www.ph.tn.tudelft.nl/Courses/FIP/frames/fip.html
http://pharyngula.org/~pzmyers/MyersLab/imaging/ip/
http://www.reindeergraphics.com/tutorial/index.shtml
http://www.mellesgriot.com/products/machinevision/machinetutorial.asp
http://machinevision.mellesgriot.com/machinevision_guide.asp
http://www.edmundoptics.com/techSupport/DisplayCategory.cfm?categoryid=18
http://www-cgi.cs.cmu.edu/afs/cs/project/cil/ftp/html/vision.html
http://homepages.inf.ed.ac.uk/rbf/CVonline/
http://homepages.inf.ed.ac.uk/rbf/HIPR2/
http://homepages.inf.ed.ac.uk/rbf/HIPR2/biblio.htm
http://iris.usc.edu/Vision-Notes/bibliography/contents.html
1
http://s2i.das.ufsc.br/
32
http://homepages.inf.ed.ac.uk/rbf/CVonline/books.htm
http://www.cs.cmu.edu/afs/cs.cmu.edu/project/cil/www/txtv-groups.html
http://sipi.usc.edu/database/
http://virtual.lncc.br/
http://www.cbpf.br/cat/pdsi
Uma forma de adquirir conhecimento prtico na rea de processamento e anlise de imagens
estudar e utilizar as funcionalidades da biblioteca computacional OPENCV. Esta biblioteca
estruturada na linguagem C e foi desenvolvida inicialmente pela Intel
2
, que no princpio abriu
seu cdigo e liberou sua utilizao sem restries. Posteriormente a Intel elaborou uma srie de
modicaes na biblioteca, criando novos mdulos para que esta rodasse de forma otimizada em
seus microprocessadores, fechando o novo cdigo produzido. A parte do cdigo da OPENCV que
permaneceu livre passou a ser administrada pela comunidade de desenvolvedores de software da
rea. Toda a documentao, cdigo fonte e exemplos de aplicao pode ser baixados do stio
3
do
projeto na internet. Outras informaes sobre a biblioteca podem ser ainda encontradas em:
http://sourceforge.net/projects/opencvucl
http://sourceforge.net/projects/fsight
http://sourceforge.net/projects/s2ilib
Este assunto no esgota-se com este mini-curso, pelo contrrio, este apenas o comeo. O
objetivo aqui despertar o interesse pelo tema ou consolidar o desejo de pesquisar e aprender mais
sobre processamento e anlise de imagens.
Contato:
Alberto Xavier Pavim (axpavim@das.ufsc.br)
Mrio Lucio Roloff (roloff@das.ufsc.br)
Correspondncia:
A/C: Prof. Dr. -Ing. Marcelo Ricardo Stemmer
Sistemas Industriais Inteligentes - S2i
Departamento de Automao e Sistemas - DAS
Centro Tecnolgico - CTC
Universidade Federal de Santa Catarina - UFSC
Caixa Postal 476 - Campus Universitrio
CEP 88040-900 Trindade Fpolis - SC - Brasil
2
http://www.intel.com/research/mrl/research/opencv/
3
http://sourceforge.net/projects/opencvlibrary/
Referncias Bibliogrcas
[1] Eduardo Pigozzi Cabral, Fernando Deschamps, and Marcelo Ricardo Stemmer. Algumas
Aplicaes da Transformada Discreta de Fourier no Processamento Digital de Imagens. In
Anais do II Simpsio Catarinense de Processamento Digital de Imagens - SCPDI, volume 1,
Florianpolis - SC - Brasil, 2002.
[2] E. R. Davies. Machine Vision - Theory Algorithms Practicalities. Elsevier - Morgan Kauf-
mann, 3 edition, 2005.
[3] Fernando Deschamps. Contribuies para o Desenvolvimento de um Sistema de Viso apli-
cado ao Monitoramento do Desgaste de Ferramentas de Corte - O Sistema ToolSpy, 2004.
[4] A. Erhardt-Ferron. Theory and Applications of Digital Image Processing. University of
Applied Sciences Offenburg, 1 edition, 2000.
[5] David A. Forsyth and Jean Ponce. Computer Vision: A Modern Approach. Prentice Hall, 1
edition, 2002.
[6] Rafael C. Gonzalez and Richard E. Woods. Digital Image Processing. Pearson Education, 2
edition, 2002.
[7] Ramesh Jain, Rangachar Kasturi, and Brian G. Schunck. Machine Vision. McGraw Hill, 1
edition, 1995.
[8] Bernd Jhne. Digitale Bildverarbeitung. Springer, Alemanha, 4 edition, 1997.
[9] Bernd Jhne, Horst Haussecker, and Peter Geissler. Handbook of Computer Vision and
Applications - Sensors and Imaging, volume 1. Academic Press, San Diego - CA, 1 edition,
1999.
[10] Bernd Jhne, Horst Haussecker, and Peter Geissler. Handbook of Computer Vision and
Applications - Signal Processing and Pattern Recognition, volume 2. Academic Press, San
Diego - CA, 1 edition, 1999.
REFERNCIAS BIBLIOGRFICAS 34
[11] Bernd Jhne, Horst Haussecker, and Peter Geissler. Handbook of Computer Vision and
Applications - Systems and Applications, volume 3. Academic Press, San Diego - CA, 1
edition, 1999.
[12] Erwin Kreyszig. Advanced Engineering Mathematics. John Wiley and Sons, Estados Unidos,
8 edition, 1999.
[13] Alan V. Oppenheim, Alan S. Willsky, and S. Hamid Nawab. Signals and Systems. Prentice
Hall, Estados Unidos, 2 edition, 1997.
[14] J. R. Parker. Algorithms for Image Processing and Computer Vision. Wiley, Estados Unidos,
1 edition, 1996.
[15] Alberto Xavier Pavim. Seminrio em Sistemas de Viso: Aplicaes no Controle de Quali-
dade e Rastreabilidade. 2002.
[16] Alberto Xavier Pavim. Contribuies na Otimizao de um Sistema de Viso para Deteco,
Medio e Classicao Automtica do Desgaste de Ferramentas de Corte em Processos de
Usinagem, 2005.
[17] William K. Pratt. Digital Image Processing: PIKS Inside. John Wiley and Sons, Estados
Unidos, 3 edition, 2001.
[18] Gerhard X. Ritter and Joseph N. Wilson. Handbook of Computer Vision Algorithms in Image
Algebra. CRC Press, 1 edition, 1996.
[19] John C. Russ. The Image Processing Handbook. CRC Press - IEEE Press, 3 edition, 1998.
[20] S. J. Sangwine and R. E. N. Horne. The Colour Image Processing Handbook. Chapman and
Hall, 1 edition, 1998.
[21] Michael Seul, Lawrence OGorman, and Michael J. Sammon. Practical Algorithms for
Image Analysis - Description, Examples, and Code. Cambridge, Estados Unidos, 1 edition,
2001.
[22] Linda Shapiro and George Stockman. Computer Vision. Prentice Hall, 1 edition, 2000.
[23] Milan Sonka, Vaclav Hlavac, and Roger Boyle. Image Processing, Analysis, and Machine
Vision. PWS Publishing, Estados Unidos, 2 edition, 1998.