You are on page 1of 39

CURSO DE PROCESSAMENTO

E ANLISE DE IMAGENS
ENECA 2005
Curso de Processamento e Anlise de Imagens
Alberto Xavier Pavim Mrio Lucio Roloff
Florianpolis, 12 de Outubro de 2005
Sumrio
1 Introduo 1
2 Processamento e Anlise de Imagens 3
2.1 Terminologia associada Viso . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Fundamentos para o Processamento e Anlise de Imagens . . . . . . . . . . . . . 5
2.2.1 Propriedades das Imagens . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2.2 Pr-Processamento de Imagens (Realce de Caractersticas) . . . . . . . . 8
2.2.3 Morfologia Matemtica . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2.4 Segmentao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3 Aplicaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3 Concluses 30
4 Informaes Gerais 31
i
Lista de Figuras
2.1 Interdependncia entre os termos da rea de sistemas de viso. . . . . . . . . . . 5
2.2 Etapas de formao das imagens em um sistema de viso. . . . . . . . . . . . . . 6
2.3 Amostragem e quantizao dos dados analgicos de uma linha da imagem. . . . 7
2.4 Vizinhanas N
4
(p), N
D
(p) e N
8
(p) do pixel p = 0. . . . . . . . . . . . . . . . . . 8
2.5 Ilustrao de caminhos conectados e regies um uma imagem binria. . . . . . . 8
2.6 Ilustrao do operador T sobre a vizinhana de um ponto da imagem. . . . . . . 9
2.7 Tpicos arranjos de operadores para processamento espacial. . . . . . . . . . . . 10
2.8 Operador 3X3 aplicado sobre a vizinhana de um ponto da imagem. . . . . . . . 11
2.9 Ilustrao de operaes bsicas de pr-processamento. . . . . . . . . . . . . . . 12
2.10 Ilustrao de operaes lgicas e aritmticas de pr-processamento. . . . . . . . 13
2.11 Ilustrao de operaes de ltragem de suavizao e enfatizao. . . . . . . . . . 14
2.12 Representao de uma imagem atravs de seu histograma. . . . . . . . . . . . . 15
2.13 Ilustrao do processo de equalizao do histograma de uma imagem. . . . . . . 16
2.14 Passos realizados no processamento frequencial de imagens. . . . . . . . . . . . 17
2.15 Representao de uma imagem no domnio da frequncia. . . . . . . . . . . . . 18
2.16 Principais formas de elementos estruturantes na morfologia matemtica. . . . . . 19
2.17 Princpio de funcionamento de operadores morfolgicos. . . . . . . . . . . . . . 20
2.18 Diversas conguraes de mscaras para a deteco de descontinuidades. . . . . 21
2.19 Deteco de pontos, linhas e bordas numa imagem. . . . . . . . . . . . . . . . . 22
2.20 Simples ilustrao de tcnicas de deteco de limiares. . . . . . . . . . . . . . . 23
2.21 Processo de segmentao por crescimento de regies. . . . . . . . . . . . . . . . 25
2.22 Processo de segmentao por diviso e agrupamento. . . . . . . . . . . . . . . . 26
2.23 Processo de segmentao por divisores de guas. . . . . . . . . . . . . . . . . . 27
2.24 Diversas reas de aplicao das tecnologias de viso e processamento de imagens. 29
ii
Nomenclatura
DFT Transformada Discreta de Fourier, do ingls Discrete Fourier Transform
IA Inteligncia Articial
OCR Reconhecimento ptico de Caracteres, do ingls, Optical Character Recognition
OCV Vericao ptica de Caracteres, do ingls, Optical Character Verication
iii
Captulo 1
Introduo
Nem todos os animais dependem tanto da viso para sua orientao como os homens. Os
seres humanos so animais que apesar de apresentarem cinco sistemas de sensoreamento viso,
audio, olfato, gustao e tato dependem e conam excessivamente na sua viso, por ser o
sentido que fornece o maior nmero de informaes necessrias para a interpretao do mundo
exterior [2, 19]. Atualmente, uma tecnologia que emula a viso humana encontra-se em avanado
desenvolvimento. Ela visa principalmente atacar problemas onde o ser humano necessite da viso
para tarefas de inspeo, classicao ou monitoramento em geral, que sejam prejudiciais ou
cansativas sade humana, ou extrapole as condies normais da viso humana, como nas tarefas
de medio ptica de preciso.
Algumas aplicaes e alguns tipos de imagens requerem uma interao visual bastante in-
tensa. Acapacidade humana para processar e interpretar imensas quantidades de dados de natureza
visual, motiva o desenvolvimento de tcnicas e dispositivos, de modo a estender ainda mais essa
capacidade e essa sensibilidade. O conhecimento de como reage o sistema visual humano e de
algumas tcnicas disponveis para melhor adequar a imagem aplicao, so importantes para
desenvolver solues computacionais automatizveis. Neste sentido, a rea de Processamento e
Anlise de Imagens permite viabilizar um grande nmero de aplicaes, tanto no domnio do
aprimoramento de informaes picturais para interpretao humana quanto no domnio da anlise
automtica por computador de informaes extradas de uma imagem ou cena.
Entre os seus objetivos principais destacam-se:
O estudo da representao das imagens, que compreende os vrios processos envolvidos na
aquisio, digitalizao, visualizao e caracterizao matemtica de imagens por meio de
transformaes ou modelos, visando o seu processamento eciente em uma etapa posterior.
O processamento de imagens propriamente dito aborda temas variados como realce, ltra-
gem, restaurao, anlise, reconstruo a partir de projees e compresso de imagens.
2
Processamento de Imagens est dentre as tecnologias computacionais que mais cresceram
nos ltimos tempos, sendo estudado por diversas reas do conhecimento, como engenharia, fsica,
medicina, cincia da computao, matemtica, astronomia e outras.
Este mini-curso ir introduzir mtodos bsicos e aplicaes de processamento digital de
imagens. O curso ser de quatro horas onde pretende-se abordar basicamente os seguintes tpicos:
1. Discusso sobre a terminologia na rea de viso.
2. Propriedades de imagens: representao, amostragem e quantizao.
3. Processamento de imagens no domnio espacial.
4. Processamento de imagens por morfologia matemtica.
5. Segmentao de imagens.
6. Aplicaes, exemplos e estudo de caso.
O acadmico ter melhor aproveitamento caso tenha um bom embasamento matemtico e
conhecimento de alguma linguagem de programao. Boa parte das informaes contidas neste
documento foram retiradas da referncia Pavim [16], a qual pode ser baixada a partir do stio do
grupo S2i
1
na internet.
1
http://s2i.das.ufsc.br/downloads/
Captulo 2
Processamento e Anlise de Imagens
Otermo processamento de imagens frequentemente confundido comoutros termos da rea
de viso. Este documento pretende iniciar uma breve discusso quanto terminologia associada
rea de viso e seguir apresentando os fundamentos da rea de processamento de imagens. Por
m so apresentadas diversas aplicaes da rea de viso.
2.1 Terminologia associada Viso
Quando nos referimos ao termo viso, mais especicamente viso de mquina (do in-
gls machine vision) ou tambm sistemas de viso, surgem uma srie de novos termos levemente
interligados, relacionados com a rea de processamento de imagens, cada qual com sua prpria
denio, mas que causamconfuso pela anidade de conceitos. No h umconsenso geral na lite-
ratura desta rea para a denio precisa desta terminologia, porm, adotaremos aqui os conceitos
apresentados por Gonzalez and Woods [6], Jain et al. [7] e Erhardt-Ferron [4], por apresentarem
certa semelhana:
Processamento de Imagens: refere-se ao processamento digital de imagens atravs de um com-
putador ou dispositivo eletrnico, onde as entradas e sadas do processamento so imagens.
Em geral so operaes de realce, restaurao, transformao ou compresso de imagens.
Enquadra-se este tipo de operao de processamento como de baixo ou at mdio nvel.
Um exemplo seria a aplicao de um ltro na imagem para realar as bordas de seus objetos.
Viso Computacional: refere-se ao processamento digital de imagens para a extrao de carac-
tersticas importantes, que auxiliem na compreenso da imagem e na tomada de decises
inteligentes. Enquadra-se este tipo de operao de processamento como de alto nvel,
sendo comum a utilizao de tcnicas de inteligncia articial para o processamento dos
dados. Um exemplo seria o reconhecimento e a classicao de um objeto da imagem.
2.1. Terminologia associada Viso 4
Anlise de Imagens: refere-se ao processamento digital de imagens onde somente as entradas do
processamento so imagens. As sadas costumam apresentar uma descrio ou represen-
tao diferente da imagem ou alguma caracterstica sua. Diz-se que a anlise de imagens
encontra-se em nvel intermedirio ao processamento de imagens e viso computacional,
enquadrando-se como operaes de mdio nvel, podendo at atingir operaes de alto
nvel. Um exemplo seria a visualizao dos dados de uma imagem a partir de seu histo-
grama, que descreve as caractersticas de luminosidade da cena ali representada.
Computao Grca: refere-se ao processo de formao de imagens a partir de um modelo de
primitivas geomtricas, como linhas e crculos, aplicado nas reas de publicidade, jogos ele-
trnicos, realidade virtual, dentre outras. A computao grca caminha no sentido inverso
da viso computacional, que pretende analisar e compreender imagens do mundo real, e no
cri-las. Porm, existe uma certa ligao destas reas, principalmente no que diz respeito s
pesquisas de realidade virtual ou de gerao de modelos 3D a partir de imagens de tomogra-
a mdica, onde ferramentas de ambas as reas so utilizadas para a gerao e apresentao
de resultados.
Reconhecimento de Padres: refere-se a operaes inteligentes na interpretao de sinais. Est
intimamente ligado viso computacional, mas no necessariamente processa apenas infor-
maes visuais para realizar o reconhecimento de caractersticas de um ambiente, pelo fato
de existiremoutros tipos de sensores dos quais poderia fazer uso, como por exemplo um sen-
sor acstico para reconhecimento de voz. Em viso computacional, trata-se da interpretao
e reconhecimento de objetos e caractersticas especcas em uma imagem.
Inteligncia Articial: refere-se modelagem de sistemas inteligentes e anlise de aspectos li-
gados inteligncia. normalmente usada junto viso computacional para a obteno,
reconhecimento e classicao de objetos e caractersticas nas imagens. Em geral aplicada
em trs etapas: percepo, cognio e ao. A etapa de percepo traduz os sinais proveni-
entes do ambiente em smbolos, a de cognio manipula estes smbolos e a de ao traduz o
resultado destes smbolos em aes que devem ser aplicadas de volta ao ambiente. O campo
de viso computacional considerado por alguns autores como sendo uma sub-rea de IA.
Sistemas de Viso: refere-se a um sistema completo, que envolve a soluo de um problema de
natureza visual, tentando criar um modelo do mundo real a partir de suas imagens. com-
posto tanto por dispositivos de hardware como por mdulos de software, fazendo uso de
uma ou at todas as demais operaes de processamento previamente citadas. Em geral,
etapas como aquisio de imagens, pr- e processamento das imagens, extrao de carac-
tersticas, tomada de deciso inteligente e atuao/realimentao esto contempladas num
sistema deste tipo.
2.2. Fundamentos para o Processamento e Anlise de Imagens 5
Figura 2.1: Interdependncia entre os termos da rea de sistemas de viso.
Fonte: Atualizada a partir de Deschamps [3].
Viso de Mquina: refere-se ao termo ingls machine vision. usado normalmente como um
sinnimo para o termo sistema de viso, porm, pode ser encontrado na literatura como
sendo a simulao e/ou incorporao do comportamento visual inteligente de humanos em
mquinas, como robs, usando extensivamente tcnicas de viso computacional e intelign-
cia articial.
A gura 2.1 a seguir ilustra a ntima ligao entre os termos e reas acima mencionados.
2.2 Fundamentos para o Processamento e Anlise de Imagens
Nesta seo apresenta-se um embasamento dos principais algoritmos e tcnicas de proces-
samento e anlise de imagens.
2.2.1 Propriedades das Imagens
As imagens digitais que so armazenadas na memria de um computador podem ser consi-
deradas funes bi-dimensionais da forma f (x, y), onde o valor de amplitude de f na coordenada
espacial (x, y) da imagem um valor inteiro no-negativo, representando o nvel de intensidade
luminosa proveniente da cena observada e registrado no sensor ptico naquele ponto [6, 23]. As
imagens geradas a partir de um processo fsico, possuem valores de f dentro de uma faixa nita e
proporcional intensidade luminosa incidente no sensor:
0 < f (x, y) < (2.1)
sendo que f pode ser interpretada como uma combinao de duas componentes: (1) a quantidade
de luz proveniente da fonte luminosa da cena e (2) a quantidade de luz reetida pelos objetos da
cena, chamados de iluminao i(x, y) e reectncia r(x, y), respectivamente:
f (x, y) = i(x, y)r(x, y) (2.2)
2.2. Fundamentos para o Processamento e Anlise de Imagens 6
Figura 2.2: Etapas de formao das imagens em um sistema de viso.
Fonte: Jhne et al. [9].
onde
0 < i(x, y) < (2.3)
e
0 < r(x, y) < 1. (2.4)
A equao 2.4 indica que a reectncia sempre limitada total absoro da luz pelos
objetos (r = 0) ou total reexo dos raios luminosos (r = 1). A natureza de i(x, y) depende da
fonte luminosa, enquanto r(x, y) depende das caractersticas superciais dos objetos observados
[6, 7].
Toda imagem captada pelo sensor ptico passa por um estgio de digitalizao do sinal, para
que possa ser compreendida pelo elemento processador do sistema (gura 2.2). Deste processo
de digitalizao da imagem, destacam-se duas tarefas muito importantes realizadas pelo conversor
analgico-digital: a amostragem e a quantizao do sinal [6, 9, 23].
A amostragem consiste em pegar amostras de pontos da informao contnua e analgica
do sinal do sensor ptico em distncias equidistantes ao longo dos eixos vertical e horizontal da
imagem, enquanto que a quantizao extrai os valores de intensidade luminosa identicados nestes
pontos amostrados. O processo de amostragem e quantizao de uma imagem est intimamente li-
gado resoluo da imagem produzida. Nota-se que quanto maior o nmero de pontos amostrados
na imagem, maior ser a resoluo espacial desta. Da mesma forma, quanto maior o nmero de
nveis de intensidade luminosa considerados na imagem para representar a tonalidade de um ponto
amostrado, maior ser a resoluo de tonalidades da imagem. A gura 2.3 ilustra a amostragem e
quantizao de um sinal analgico para transform-lo em um sinal digital.
Desta forma, ca fcil enxergar a organizao de uma imagem de acordo com uma estrutura
matricial, onde o nmero de elementos (pontos ou pixels) das linhas e colunas da matriz (imagem)
determinado pela amostragem do sinal, e o valor numrico dos elementos extrado da quan-
tizao da intensidade luminosa incidente em cada ponto amostrado da matriz no sensor ptico
[6, 9, 23].
2.2. Fundamentos para o Processamento e Anlise de Imagens 7
Aquisio de uma linha contnua da imagem Amostragem e quantizao da linha
Figura 2.3: Amostragem e quantizao dos dados analgicos de uma linha da imagem.
Uma imagem com M linhas e N colunas possui em seu ponto de origem um valor de inten-
sidade luminosa correspondente a f (0, 0) e no seu ponto nal f (M1, N1). Os demais pontos
intermedirios esto dispostos segundo a estrutura matricial da equao 2.5:
f (x, y) =

f (0, 0) f (0, 1) f (0, N1)


f (1, 0) f (1, 1) f (1, N1)
.
.
.
.
.
.
.
.
.
.
.
.
f (M1, 0) f (M1, 1) f (M1, N1)

(2.5)
Nota-se que diversas operaes matemticas aplicadas a matrizes podem tambm ser utili-
zadas na rea de processamento de imagens. Para prosseguir com um estudo mais aprofundado
sobre estas operaes, desejvel ainda introduzir algumas propriedades e relacionamentos entre
os elementos ou pixels internos de uma imagem: vizinhana, adjacncia, conectividade, regio e
limite [6].
Um pixel p nas coordenadas (x, y) de uma imagem possui 4 vizinhos horizontais e verticais
nas seguintes coordenadas: (x +1, y), (x 1, y), (x, y +1), (x, y 1). O conjunto destes pixels
vizinhos denota-se N
4
(p). Neste conjunto, todos os pixels vizinhos de p encontram-se a uma
unidade de distncia de (x, y). J os outros 4 vizinhos diagonais de p encontram-se nas coorde-
nadas: (x +1, y +1), (x +1, y 1), (x 1, y +1), (x 1, y 1), sendo que o cojunto destes pixels
vizinhos denota-se N
D
(p). Este conjunto, juntamente com N
4
(p) forma um novo conjunto deno-
minado N
8
(p), que engloba todos os pixels vizinhos de p. H a possibilidade de algum destes
pixels vizinhos permanecerem fora dos limites da imagem, caso p encontre-se em uma de suas
bordas. A gura 2.4 ilustra as vizinhanas (representadas por 1) N
4
(p), N
D
(p) e N
8
(p) para um
dado pixel p = 0.
A partir do conceito de vizinhana, dene-se a adjacncia. Diz-se que o pixel q adjacente
de p quando q encontra-se na vizinhana de p e satisfaz ainda uma condio de semelhana
2.2. Fundamentos para o Processamento e Anlise de Imagens 8
1
1 0 1
1
1 1
0
1 1
1 1 1
1 0 1
1 1 1
N
4
(p) N
D
(p) N
8
(p)
Figura 2.4: Vizinhanas N
4
(p), N
D
(p) e N
8
(p) do pixel p = 0.
0 0 1 1 0
S p
1
q
1
1 0 0
0 1 1 0 1
0 1 0 0 p
3
R
p
2
q
2
0 0 q
3
Figura 2.5: Ilustrao de caminhos conectados e regies um uma imagem binria.
ou anidade de intensidade luminosa. Ou seja, alm de ser vizinho, deve possuir um valor de
intensidade dentro de uma faixa especca de tons, a denir.
Dado um conjunto de pixels S numa imagem, dois pixels, p na coordenada (x, y), e q na
coordenada (t, u), sero conexos quando entre eles houver um caminho de pixels adjacentes
ligando-os, todos pertencentes ao conjunto S. De forma semelhante, um conjunto de pixels R
numa imagem s poder ser considerado uma regio da imagem caso todos seus pixels sejam
conexos, e formem um conjunto completo conectado. Para nalizar, dene-se o limite L de uma
regio R como sendo o conjunto de pixels de R que possuem um ou mais vizinhos no-pertencentes
R.
Na gura 2.5 podemos avaliar os conceitos cima denidos. Nota-se que para o conjunto S,
existe uma conexo entre os pontos p
1
e p
2
caso ambos tenham valor 0, assim como para q
1
e q
2
caso ambos tenham valor 1. J para o conjunto R, podemos declar-lo como uma regio caso os
pontos p
3
e q
3
tenham valor 0, concretizando a conexo completa de todos os pontos do conjunto.
Mais informaes sobre propriedades das imagens em [2, 5, 6, 7, 8, 17, 18, 22, 23].
2.2.2 Pr-Processamento de Imagens (Realce de Caractersticas)
Operaes de pr-processamento so aplicadas em uma imagem para alcanar como resul-
tado outra imagem com caractersticas realadas, mais adequadas para prosseguir com as demais
etapas de processamentos necessrias [6]. Existem inmeras tcnicas de realce de imagens. Den-
tre as mais conhecidas esto as de ltragem nos domnios espacial e frequencial, conforme ser
visto nas sub-sees seguintes.
2.2. Fundamentos para o Processamento e Anlise de Imagens 9
Figura 2.6: Ilustrao do operador T sobre a vizinhana de um ponto da imagem.
Fonte: Gonzalez and Woods [6].
Estas tcnicas de pr-processamento enquadram-se entre as tcnicas de baixo nvel (con-
forme levantado na seo 2.1), recebendo imagens na entrada e resultando em imagens tambm
na sada. O estudo destas tcnicas fundamental inclusive para a compreenso de muitas outras
tcnicas de processamento de imagens, que baseiam-se nestes conceitos para gerao de novas
solues no processamento das imagens. As informaes contidas nesta sub-seo baseiam-se
principalmente em [6] e podem ser encontradas mais aprofundadas em [2, 5, 7, 10, 14, 17, 18, 19,
20, 21, 22, 23].
Pr-Processamento no Domnio Espacial
O processamento no domnio espacial refere-se a procedimentos que operam diretamente
sobre os pixels de uma imagem, na forma como esto arranjados espacialmente. Uma operao de
processamento espacial denotada da seguinte forma:
g(x, y) = T[ f (x, y)] (2.6)
onde f (x, y) representa a imagem de entrada, g(x, y) representa a imagem de sada realada, e T
um operador em f , denido para atuar sobre a vizinhana do ponto (x, y). A ilustrao deste
procedimento pode ser vista na gura 2.6.
O operador T pode atuar em diferentes tamanhos de vizinhana no ponto (x, y), porm, o
mais comum que esta apresente um formato circular, quadrangular ou retangular, centrado sobre
o ponto (x, y). Tpicos arranjos de operadores quadrangulares podem ser vistos na gura 2.7.
Da gura vemos que a menor e mais simples vizinhana em torno do ponto (x, y) o prprio
ponto (operador 1X1). Quando T tem este tamanho de vizinhana ele chamado de funo de
2.2. Fundamentos para o Processamento e Anlise de Imagens 10
w
1
w
1
w
2
w
3
w
4
w
5
w
6
w
7
w
8
w
9
w
1
w
2
w
3
w
4
w
5
w
6
w
7
w
8
w
9
w
10
w
11
w
12
w
13
w
14
w
15
w
16
w
17
w
18
w
19
w
20
w
21
w
22
w
23
w
24
w
25
w
1
w
2
w
3
w
4
w
5
w
6
w
7
w
8
w
9
w
10
w
11
w
12
w
13
w
14
w
15
w
16
w
17
w
18
w
19
w
20
w
21
w
22
w
23
w
24
w
25
w
26
w
27
w
28
w
29
w
30
w
31
w
32
w
33
w
34
w
35
w
36
w
37
w
38
w
39
w
40
w
41
w
42
w
43
w
44
w
45
w
46
w
47
w
48
w
49
1X1 3X3 5X5 7X7
Figura 2.7: Tpicos arranjos de operadores para processamento espacial.
transformao de intensidade, pois opera diretamente no valor de intensidade do ponto (x, y)
da imagem f , gerando um novo valor de intensidade para o mesmo ponto na imagem g. Caso
este operador passasse por toda a rea da imagem f somando a cada ponto um certo nvel de
intensidade luminosa, geraria uma imagem g mais clara. Estas operaes de vizinhana unitria
so tambm conhecidas como processamento pontual.
J as demais conguraes de operadores (3X3, 5X5, 7X7) so utilizadas especialmente
em operaes de ltragem de imagens, e so mais conhecidas na literatura de processamento de
imagens como mscaras, kernels ou ltros de convoluo. Uma operao de ltragem linear para
uma mscara de tamanho 3X3 poderia ser denida da seguinte forma:
R = w(1, 1) f (x 1, y 1) +w(1, 0) f (x 1, y) + +
w(0, 0) f (x, y) + +w(1, 0) f (x +1, y) +w(1, 1) f (x +1, y +1),
onde R o resultado da operao linear aplicada sobre o ponto (x, y) e sua vizinhana na imagem
f , gerando o valor de intensidade luminosa para apenas um ponto (de coordenadas (x, y)) na
imagem g. A operao ilustrada na gura 2.8. Desta forma, cada ponto da imagem g gerado
levando-se em conta uma operao linear aplicada a nove pontos da imagem f . A nova e completa
imagem g formada ao aplicar-se o operador cima citado sobre toda a regio da imagem f , ou
seja, movendo a mscara de ltragem sobre os pontos da imagem, de maneira semelhante ao que
ocorre em operaes de convoluo de sinais unidimensionais.
Das operaes de processamento pontual ou por mscara de convoluo, surgem uma srie
de operaes bsicas, lgicas, aritmticas e de ltragem para aplicao em domnio espacial nas
imagens. Dentre as operaes bsicas, baseando-se em operaes de processamento pontual, as
mais comumente empregadas podem ser vistas na gura 2.9, seguindo uma sucinta descrio:
Identidade: nada mais do que uma cpia idntica, ponto a ponto da imagem original.
Negativa: a negativa de uma imagem f obtida ao inverter-se a intensidade luminosa de todos
os pontos da imagem, resultando em uma nova imagem g com aspecto semelhante a um
2.2. Fundamentos para o Processamento e Anlise de Imagens 11
Figura 2.8: Operador 3X3 aplicado sobre a vizinhana de um ponto da imagem.
Fonte: Gonzalez and Woods [6].
negativo fotogrco. Ou seja, para uma imagem f com uma faixa de tons de cinza variando
de [0, L1], a negativa desta imagem obtida pela expresso: g(x, y) = (L1) f (x, y).
Esta operao adequada para destacar pequenos detalhes brancos ou cinza sobre grandes
reas negras.
Logartmica: esta operao aplica uma transformao logartmica cada ponto de uma imagem
f , conforme a expresso: g(x, y) = clog(1+ f (x, y)), onde c uma constante a ser denida.
Esta operao normalmente mapeia uma faixa de baixos valores de intensidade luminosa
para faixas maiores, tornando visveis partes da imagem que encontravam-se muito escuras.
Potncia: esta operao aplica uma transformao de potncia cada ponto de uma imagem f ,
conforme a expresso: g(x, y) = c( f (x, y) +)

, onde c uma constante a denir, um


offset e a potncia a qual se deseja elevar o nvel de intesidade luminosa de f (x, y). Funci-
ona de forma semelhante logartmica, normalmente realando pontos de baixa intensidade
luminosa.
Quanto s operaes lgicas e aritmticas, alguns exemplos podem ser vistos na gura 2.10,
tendo como principais operaes:
Aritmticas: compreendem a soma, subtrao, multiplicao e diviso entre pixels de duas ima-
gens, resultando em uma nova imagem. Estas operaes evidentemente sofrem uma limita-
o pela faixa de valores de intensidade luminosa possveis de serem assumidos pelos pixels
da imagem, saturando nos limites inferior (nulo) e superior (comumente 255) sempre que
2.2. Fundamentos para o Processamento e Anlise de Imagens 12
Original Negativa
Logartmica Potncia
Figura 2.9: Ilustrao de operaes bsicas de pr-processamento.
ultrapassarem estes limites de resoluo. Estas operaes so comumente usadas para am-
pliar o nvel de intensidade luminosa de imagens, encontrar diferenas entre duas imagens
semelhantes, eliminar/incluir rudos e gerar novas imagens a partir de uma mdia de outras
imagens.
Lgicas: compreendem as trs operaes lgicas bsicas E, OU e NAO, sendo possvel a partir
destas construir suas derivadas. As operaes E e OU operam sobre duas imagens, en-
quanto que a NAO opera sobre apenas uma. So usadas principalmente para selecionar ou
destacar reas especcas das imagens (regies de interesse ROIs), alm de serem muito
importantes para as operaes de morfologia, vistas na sub-seo 2.2.3.
Por ltimo, temos as mais importantes operaes de pr-processamento no domnio es-
pacial, as operaes de ltragem, que baseiam-se nos princpios de convoluo de mscaras
pr-conguradas para realar caractersticas especcas das imagens. As operaes de ltragem
dividem-se entre operaes de suavizao (smoothing) e enfatizao (sharpening). Em geral ope-
raes de suavizao procuram atenuar o nvel de rudo nas imagens, removendo pequenos de-
talhes e suavizando contornos. J as operaes de enfatizao procuram destacar detalhes da
2.2. Fundamentos para o Processamento e Anlise de Imagens 13
Imagem (1) Imagem (2)
Subtrao de (1) e (2) Operao OU entre (1) e (2) Operao E entre (1) e (2)
Figura 2.10: Ilustrao de operaes lgicas e aritmticas de pr-processamento.
imagem, principalmente cantos e arestas. As principais tcnicas utilizadas so ilustradas na gura
2.11 e descritas a seguir:
Suavizao Linear: estes ltros so aplicados para gerar novas imagens com aspecto mais su-
ave, pois calculam o novo valor de intensidade luminosas de um dado ponto a partir de uma
mdia linear dos valores de intensidade dos pontos vizinhos, de acordo com o tamanho da
mscara de convoluo usada. Numa congurao de mscara 3X3, com todos os vizinhos
sendo levados em conta da mesma maneira, a operao se resumiria na seguinte expres-
so: g(x, y) =
1
9

9
i=1
f
i
. Porm, possvel adotar uma mscara que priorize ou conceda
maior peso para vizinhos especcos, buscando um comportamento mais adequado para a
aplicao.
Estatsticos No-Lineares: estes ltros so aplicados para gerar novas imagens comaspecto mais
limpo e suave, especialmente em casos para supresso de modelos de rudos comportados.
A resposta destes ltros no-lineares para um dado ponto na imagem baseada na anlise
estatstica do valor de intensidade luminosa de seus pontos vizinhos, que so ordenados con-
forme uma regra especca para posteriormente substituir o valor de intensidade do ponto
central de acordo com a classicao da ordenao. Como exemplo, temos o ltro medi-
ano, que analisa o valor de intensidade dos pontos vizinhos e retorna o valor daquele que
est mais prximo da mdia dos valores encontrados. Existem ainda o ltro mximo e o
mnimo, que retornam respectivamente, os valores mximo e mnimo dos pontos encon-
2.2. Fundamentos para o Processamento e Anlise de Imagens 14
Original Suavizao Linear
Gradiente Laplaciano
Figura 2.11: Ilustrao de operaes de ltragem de suavizao e enfatizao.
trados na vizinhana.
Gradiente: estes ltros baseiam-se nas denies da primeira derivada de sinais uni-dimensionais,
que realam as bruscas variaes encontradas nestes sinais. Sendo as imagens nada mais
do que um sinal bi-dimensionail, utiliza-se o conceito de gradiente para aplicar os a deri-
vao de primeira ordem toda a rea da imagem. Desta forma, a derivao dos sinais de
intensidade luminosa da imagem resultam no realce das regies de transio abrupta desta
intensidade, ou seja, um destaque especial para os cantos e bordas de objetos na imagem,
eliminando muito da informao constante na imagem.
Laplaciano: similar aos ltros gradientes, estes tambm baseiam-se na aplicao de derivadas
s imagens para realar cantos e arestas de objetos. Porm estes ltros aplicam a segunda
derivada sobre as imagens, ao invs da primeira.
Pr-Processamento Estatstico
As tcnicas de processamento estatstico formam um subconjunto distinto das tcnicas de
processamento espacial, baseando-se na anlise de informaes estatsticas da imagem. Dentre
2.2. Fundamentos para o Processamento e Anlise de Imagens 15
Imagem Original Histograma da Imagem
Figura 2.12: Representao de uma imagem atravs de seu histograma.
estas tcnicas, as mais conhecidas so as de manipulao dos histogramas das imagens.
Um histograma uma forma distinta de se enxergar os dados de uma imagem. Trata-se
de um grco com dois eixos, um horizontal, cobrindo todos os nveis de intensidade luminosa
possveis para a representao do valor de um pixel da imagem, e outro vertical, representando
o nmero de pixels com um nvel de intensidade luminosa especco na imagem. O histograma
pode ser avaliado a partir da expresso: H(r
k
) = n
k
, onde r
k
o k-simo nvel de intensidade
luminosa possvel, de uma faixa que varia entre [0, L 1], e n
k
o nmero de pixels contendo
nvel de intensidade luminosa igual a r
k
na imagem. A gura 2.12 ilustra uma imagem e o seu
respectivo histograma.
Tambm comum encontrarmos um histograma em sua forma normalizada, ou seja, seu
eixo vertical sofre pequena alterao (diviso do nmero de pixels das colunas do histograma pelo
nmero de pixels total da imagem), resultando na probabilidade de ocorrncia de cada nvel de
intensidade luminosa na imagem: P(r
k
) =
n
k
n
, onde P(r
k
) a probabilidade com que o nvel de
intensidade luminosa r
k
aparece na imagem.
Histogramas so ferramentas poderosas, de fcil e rpido clculo, e sua manipulao gera
um vasta gama de efeitos desejveis para operaes de realce, segmentao e compresso de
imagens. Uma das maiores utilidades de um histograma o realce de imagens a partir do sua
equalizao. A equalizao consiste numa transformao da imagem a partir da redistribuio dos
nveis de intensidade luminosa de seus pontos, de forma a atingir uma distribuio mais uniforme
de uma faixa ou de toda a faixa de intensidades luminosa do histograma da imagem (gura 2.13).
Desta forma, imagens escuras de nveis de intensidade luminosa predominantemente baixos
(comprimidos na parte esquerda do histograma), teriam estes valores de intensidade redistribu-
dos, de gerando um histograma mais uniforme, ocupando maior parte da vasta faixa de nveis de
intensidade luminosa. Isto resulta em uma imagem mais clara e ntida, com maior contraste entre
2.2. Fundamentos para o Processamento e Anlise de Imagens 16
Imagem Equalizada Histograma Equalizado
Figura 2.13: Ilustrao do processo de equalizao do histograma de uma imagem.
os objetos e o fundo da imagem. O mesmo princpio pode ser aplicado imagens muito claras,
buscando realar caractersticas importantes da imagem para permitir futuros processamentos.
Pr-Processamento no Domnio Frequencial
O processamento no domnio frequencial semelhante ao feito no domnio espacial, porm
os operadores utilizados nas tarefas de ltragem mudam signicativamente, tendo em vista que
agora a busca pelas caractersticas da imagem se d no plano frequencial, que na verdade uma
nova estrutura de representao das informaes da imagem original. O que antes era analisado
no domnio espacial de f (x, y), agora analisado em F(u, v), que a representao da imagemf
no domnio frequencial.
A ferramenta utilizada para mapear os dados de f do domnio espacial para F no domnio
frequencial a Transformada Discreta de Fourier (DFT). Esta ferramenta mapeia as caractersticas
do sinal no tempo (espao) para um somatrio de senos e cossenos com seus respectivos pesos, de
forma a traduzir perfeitamente o sinal para o domnio da frequncia. Para retornar ao domnio do
tempo, sem perdas de informaes, basta aplicar a transformada inversa ao sinal frequencial. A
teoria matemtica por trs desta ferramenta extensa e possui rica literatura, no fazendo parte do
escopo deste trabalho aprofundar-se em maiores detalhes de seu funcionamento. Maiores detalhes
sobre operaes em domnios frequenciais pode ser encontrada em [1, 6, 12, 13].
O processamento no domnio frequencial costuma ser mais custoso e demorado, devido ao
nmero maior de etapas de processamento a serem cumpridas, e pela natureza das mscaras de
convoluo frequenciais, que so bem maiores do que as utilizadas no processamento espacial. O
processamento de uma imagem no domnio da frequncia, segue os seguintes passos (gura 2.14)
[6]:
2.2. Fundamentos para o Processamento e Anlise de Imagens 17
Figura 2.14: Passos realizados no processamento frequencial de imagens.
Fonte: Gonzalez and Woods [6].
1. Multiplicar a imagem no domnio espacial por um fator (1)
x+y
, para auxiliar o clculo
posterior da DFT (pois centraliza as informaes da transformada na imagem).
2. Calcular a DFT da imagem f propriamente dita, gerando F(u, v).
3. Aplicar uma funo de ltragem H(u, v) sobre a imagem F, de acordo com as caractersticas
que se deseja realar na imagem, gerando uma nova imagem: G(u, v) = H(u, v)F(u, v).
4. Calcular a DFT inversa do resultado da ltragem (G) realizado no passo 3, trazendo a ima-
gem de volta ao domnio espacial com as modicaes da ltragem.
5. Extrair apenas a parte real do resultado obtido da DFT inversa no passo 4.
6. Multiplicar esta parte real novamente por (1)
x+y
para rearranjar a imagem corretamente
no domnio espacial e possibilitar a visualizao dos resultados.
As imagens F geradas no domnio frequencial pouco ou nada tem a ver no aspecto visual
com suas imagens f originais no domnio espacial, conforme visto na gura 2.15.
Existem dois tipos principais de ltros frequenciais comumente empregados: os ltros
passa-baixa (ou de suavizao) e os ltros passa-alta (ou de enfatizao).
Passa-Baixa: anlogos aos ltros de suavizao no domnio espacial, porm com uma congu-
rao da mscara de convoluo diferente, que permite realizar as mesmas operaes de
suavizao de cantos e arestas e reduo de rudos no domnio frequencial.
Passa-Alta: anlogos aos ltros de enfatizao do domnio espacial, porm com uma congura-
o da mscara de convoluo diferente, que permite realizar as mesmas operaes de realce
de cantos e arestas no domnio frequencial.
2.2. Fundamentos para o Processamento e Anlise de Imagens 18
Imagem Original Rerpesentao Frequencial
Figura 2.15: Representao de uma imagem no domnio da frequncia.
Fonte: http://homepages.inf.ed.ac.uk/rbf/HIPR2/freqfilt.htm
2.2.3 Morfologia Matemtica
A morfologia uma rea da biologia que estuda a forma e estrutura dos animais e das
plantas. O mesmo termo usado aqui para caracterizar uma rea do processamento de imagens,
porm, costuma-se usar o termo completo morfologia matemtica para fazer distino entre as
diferentes reas. Analogamente diz-se que a morfologia matemtica uma ferramenta para extrair
caractersticas importantes da estrutura de alguns componentes da imagem [6]. Desta maneira, a
morfologia matemtica representa um elo entre as operaes de processamento de baixo e mdio
nvel (conforme seo 2.1), pois geram tanto resultados em forma de imagens como atributos e
caractersticas especcas de alguns de seus objetos.
A morfologia matemtica baseia-se fortemente na teoria de conjuntos e em operaes lgi-
cas para denir uma vasta gama de ferramentas teis ao processamento de imagens, principalmente
imagens binrias, mas extendendo-se tambm (com algumas adaptaes) s imagens de tons de
cinza e coloridas. Est fora do escopo deste trabalho apresentar base em teoria dos conjuntos e
operaes lgicas, que podem ser encontradas em outra literatura [6]. O que ser apresentado aqui
apenas uma descrio e exemplicao dos principais operadores morfolgicos aplicados ao pro-
cessamento de imagens, havendo maiores informaes em [2, 6, 10, 14, 17, 18, 19, 20, 21, 22, 23].
De um modo geral, todos os operadores morfolgicos baseiam-se no conceito da aplicao
de um elemento estruturante percorrendo sobre uma imagem, de modo anlogo ao que ocorre
com as mscaras de convoluo nas operaes de ltragem. As principais estruturas de elementos
estruturantes podem ser vistas na gura 2.16, que similar s conguraes de vizinhana N
4
(p)
e N
8
(p) vistas anteriormente na parte de pr-processamento no domnio espacial.
Segue uma descrio das operaes bsicas de morfologia matemtica:
2.2. Fundamentos para o Processamento e Anlise de Imagens 19
Figura 2.16: Principais formas de elementos estruturantes na morfologia matemtica.
Dilatao: a aplicao de um elemento estruturante de forma concntrica sobre um conjunto
denido de pontos (brancos ou pretos) em uma imagem, de maneira que o elemento estru-
turante adicione informao sobre a vizinhana destes pontos. Ou seja, pode-se imaginar
que o elemento estruturante desliza sobre um conjunto de pontos dilatando sua vizinhana
numa proporo que varia conforme as dimenses do elemento estruturante. Esta operao
utilizada principalmente para preencher intervalos e lacunas indesejveis na imagem.
Eroso: o inverso da dilatao. A aplicao do elemento estruturante ocorre analogamente
operao anterior, porm, ao invs de dilatar a vizinhana do ponto percorrido inserindo
informao, o elemento retira informao (gerando eroso nas reas percorridas). Esta ope-
rao utilizada principalmente para eliminar detalhes irrelevantes, como rudos, e abrir
intervalos ou lacunas em regies de conexo indesejada.
Abertura: derivada das operaes de dilatao e eroso. O operador de abertura aplica uma
eroso seguida de uma de dilatao na imagem. Esta sequncia de operaes visa elimi-
nar pequenos rudos na imagem e abrir lacunas em regies de fraca conexo entre objetos,
atravs da eroso, e posteriormente tenta restaurar as dimenses reais de objetos da imagem
atravs da dilatao. Os rudos e fracas conexes eliminados com a eroso no retornam
imagem aps a dilatao.
Fechamento: tambm derivada das operaes de dilatao e eroso, trata-se da operao inversa
da abertura, aplicando primeiramente uma dilatao seguida de uma eroso. Esta sequncia
de operaes visa restaurar conexes fracas entre objetos da imagem.
A gura 2.17 ilustra o princpio de funcionamento destes operadores morfolgicos bsicos
aplicados em uma imagem binria. A partir destas ferramentas bsicas, outros algoritmos morfo-
lgicos so desenvolvida, como por exemplo, algoritmos para extrao de bordas, preenchimento
de regies, extrao de componentes conexos, anamento, engrossamento e desbaste de regies e
esqueletonizao [6].
2.2. Fundamentos para o Processamento e Anlise de Imagens 20
Imagem Original Operao de Eroso Operao de Dilatao
Elemento Estruturante Operao de Abertura Operao de Fechamento
Figura 2.17: Princpio de funcionamento de operadores morfolgicos.
Fonte: Gonzalez and Woods [6].
2.2.4 Segmentao
O objetivo das tcnicas de segmentao dividir a imagem em suas diversas partes consti-
tuintes ou segmentos (objetos e regies). O nvel ou quantidade de divises aplicadas na imagem
varia conforme a aplicao, e em geral realizada at atingir um nvel de separao suciente
entre os objetos de interesse na cena analisada [6]. As tcnicas de segmentao do um passo
frente das tcnicas de morfologia matemtica quanto classicao (seo 2.1), enquadrando-se
dentre as tcnicas de mdio e alto nvel de processamento de imagens.
Os algoritmos de segmentao baseiam-se principalmente em duas propriedades do nvel de
intensidade luminosa das imagens: a descontinuidade e a similaridade. Quanto descontinui-
dade, a idia est em dividir a imagem em regies de acordo com as mudanas abruptas do nvel
de intensidade luminosa em seus pontos, por exemplo, cantos e arestas de objetos na imagem. J
por similaridade, a imagem dividida em regies de acordo com algum padro de similaridade
entre estas regies, como por exemplo, o nvel de intensidade luminosa, a cor e a textura.
Dentre as tcnicas de segmentao mais conhecidas destacam-se a deteco de descontinui-
dades, a deteco de limiares (thresholding), a segmentao baseada em regies e a segmentao
por divisores de gua (watersheds). Os princpios de funcionamento de cada uma destas tcni-
cas so introduzidos a seguir, baseados em [6]. Demais informaes podem ser encontradas em
[2, 5, 6, 7, 10, 14, 17, 18, 19, 20, 22, 23].
2.2. Fundamentos para o Processamento e Anlise de Imagens 21
1 2 1
0 0 0
1 2 1
1 1 1
0 0 0
1 1 1
1 1 1
2 2 2
1 1 1
1 1 1
1 8 1
1 1 1
Sobel Horizontal Prewitt Horizontal Linha Horizontal Laplace
1 0 1
2 0 2
1 0 1
1 0 1
1 0 1
1 0 1
1 2 1
1 2 1
1 2 1
0 1 0
1 4 1
0 1 0
Sobel Vertical Prewitt Vertical Linha Vertical Laplace
2 1 0
1 0 1
0 1 2
1 1 0
1 0 1
0 1 1
1 1 2
1 2 1
2 1 1
1 0 0 1
0 1 1 0
Sobel Diagonal Prewitt Diagonal Linha Diagonal Roberts
Figura 2.18: Diversas conguraes de mscaras para a deteco de descontinuidades.
Deteco de Descontinuidades
A segmentao por deteco de descontinuidades procura regies de transio abrupta do
nvel de intensidade luminosa dos pontos da imagem para realizar as divises. Dentre as des-
continuidades mais comuns encontram-se pontos, linhas e bordas. Estas tcnicas de deteco de
descontinuidades fazem uso extenso das tcnicas de pr-processamento de imagens, em especial a
ltragem para enfatizao de caractersticas (sharpening lters), tanto no domnio espacial quanto
frequencial. Existem inmeras conguraes padres de mscaras de convoluo prprias para a
deteco de cada uma destas caractersticas, como pode ser visto na gura 2.18.
Para a deteco de pontos de descontinuidade na imagem, so muito utilizadas as congu-
raes de mscaras de laplace, que do maior nfase para o ponto centrado na mscara e reduz a
inuncia de seus vizinhos. J para deteco de linhas pode se usar mscaras especiais para nfase
de linhas horizontais, verticais ou na diagonal, que funcionam analogamente deteco de pontos,
reduzindo a inuncia de pontos vizinhos linha. Na deteco de bordas de objetos, vrias so as
possibilidades usadas, sendo as mais comuns apresentadas por Roberts, Prewitt e Sobel, que so
operadores baseados no conceito de gradiente. Esta estratgia se faz necessria tendo em vista que
as bordas no costumam ser abruptas (mudana radical no nvel de intensidade luminosa), mas
sim suaves e contnuas (semelhantes ao sinal de uma rampa). Desta forma, um ltro do tipo gra-
diente procura enfatizar esta mudana gradual e suave das bordas dos objetos. De forma anloga
deteco de linhas, pode-se utilizar um ltro especco para valorizar bordas horizontais, verticais
2.2. Fundamentos para o Processamento e Anlise de Imagens 22
Imagem Original Deteco de Bordas
Deteco de Linhas Horizontais Deteco de Linhas Verticais
Figura 2.19: Deteco de pontos, linhas e bordas numa imagem.
ou diagonais. A gura 2.19 ilustra as operaes de deteco linhas e bordas.
Deteco de Limiares (Thresholding)
A deteco de limiares uma das tcnicas de segmentao mais simples e fceis de aplicar,
sendo usado constantemente em qualquer aplicao de processamento de imagens. A tcnica
procura agrupar os diferentes objetos e regies da imagem conforme a similaridade de tonalidades
(nvel de intensidade luminosa) entre os mesmos.
A operao de limiarizao simples corresponde denio de um valor T de limiar para o
nvel de intensidade luminosa ao qual deseja-se realizar o ponto de corte (binarizao) da imagem.
Em uma imagem de 256 tons de cinza, caso T =50, todas as tonalidades entre 0 e 50 ( f (x, y) <T)
tornar-se-iam informao de fundo da imagem (valor 0 binrio, ou cor preta). J os demais valores
a partir deste limiar ( f (x, y) >T) tornar-se-iam informao correspondente aos objetos da imagem
(valor 1 binrio, ou cor branca). Desta forma, a simples denio de um valor de limiar ou de corte
j suciente para dividir a imagem em duas regies: fundo e objetos, sendo til quando j existe
bom contraste entre estas regies e apresentando resultados pobres em situaes mais adversas.
2.2. Fundamentos para o Processamento e Anlise de Imagens 23
Imagem Original Histograma e Limiar Imagem Binarizada
Imagem Original Histograma e Mltiplos Limiares Imagem Binarizada
Figura 2.20: Simples ilustrao de tcnicas de deteco de limiares.
possvel ainda denir mltiplos limiares de corte (multilevel thresholding), e denir faixas
de valores de intensidade luminosa para cada entidade da imagem. Por exemplo, caso existam para
uma imagem f (x, y) dois valores distintos de limiar (T
1
e T
2
), dene-se que todos os valores em
que f (x, y) <T
1
correspondem ao fundo da imagem, enquanto os valores em que T
1
> f (x, y) >T
2
correspondem a um determinado objeto, e quando f (x, y) > T
2
h um outro objeto correspondente
na cena. possvel denir mais valores de limiar, porm, situaes que demandam diferentes
valores de limiar para realizar sua segmentao so normalmente melhor solucionadas por tcnicas
de segmentao baseadas em regies.
A gura 2.20 ilustra estas duas situaes descritas cima. Nota-se a clareza de informaes
passada pelos histogramas das imagens em relao escolha dos pontos de limiar.
Formalmente denimos a limiarizao como uma operao de testes contra uma varivel T:
T = T[x, y, p(x, y), f (x, y)] (2.7)
onde f (x, y) representa a intensidade luminosa de um ponto e p(x, y) representa uma propriedade
local deste ponto na imagem, como por exemplo, a mdia de intensidade luminosa de seus vizi-
nhos. A partir desta expresso, dene-se uma imagem limiarizada (binarizada por um limiar):
g(x, y) =

1 if f (x, y) > T
0 if f (x, y) T
(2.8)
Assim, pontos da imagem rotulados com o valor 1 representam objetos da imagem, e pon-
tos rotulados com o valor 0 representam o fundo da imagem. Quando a expresso de T depende
2.2. Fundamentos para o Processamento e Anlise de Imagens 24
apenas de f (x, y) (nvel de intensidade luminosa), diz-se que a operao corresponde a uma limi-
arizao global. Se T depende tambm de p(x, y), este chamado de limiarizao local. Caso
T ainda dependa das coordenadas espaciais x e y, alm de f e p, este chamado de limiarizao
dinmica ou adaptativa [6]. Cada um destes tipos de limiarizao possuem uma abordagem e
implementao levemente diferente, porm, no sero detalhados mais a fundo neste trabalho.
Segmentao Baseada em Regies
Este tipo de segmentao divide a imagem procurando por regies que atendam a algum
tipo de similaridade. Em geral, uma imagem segmentada formada por um nmero n de regies
de pontos na imagem (como visto na sub-seo 2.2.1), sendo que a unio destas regies compe a
imagem completa. As regies devemsempre ser disjuntas e atender a um determinado critrio para
o agrupamento de seus pontos. Duas tcnicas so bem conhecidas: segmentao por crescimento
de regies (region growing) e por diviso e agrupamento de regies (split and merge).
A segmentao por crescimento de regies um procedimento que agrupa pontos e pe-
quenas sub-regies da imagem em maiores regies, de acordo com um critrio de semelhana
pr-denido. Em geral, parte-se de um conjunto de pontos ditos sementes, e a partir destes
pontos inicia-se um processo de crescimento de regies, agrupando todos os pontos vizinhos que
respeitem o critrio de semelhana com a semente. comum que para cada aplicao tenha-se
uma ligeira noo de que pontos serviriam como boas sementes para o incio do algoritmo (nor-
malmente faixas especcas de intensidade luminosa na imagem).
A escolha pelo critrio de similaridade entre os pontos varia conforme a aplicao e o tipo
de imagem sendo usada. Dentre os critrios mais utilizados destacam-se a intensidade luminosa, a
textura, e a cor dos pontos. Alguns outros critrios fornecem ao algoritmo uma certa inteligncia
para a reunio dos pontos, como analisar as propriedades de adjacncia e conectividade dos mes-
mos enquanto forma-se a regio. Critrios para a parada do algoritmo costumam ser o tamanho e
a forma das regies formadas, assim como a similaridade de caractersticas de novos pontos para
adentrar uma determinada regio. A segmentao por cresciemento de regies ilustrado na gura
2.21.
J a segmentao por diviso e agrupamento aborda uma soluo diferente para classi-
car e agrupar regies da imagem. A idia consiste em iniciar uma srie de divises sistemticas a
partir da imagem original, at alcanar inmeras divises distintas que realmente formem regies
na imagem. Ou seja, nestas divises todos os pontos devem obedecer a um critrio de simila-
ridade para poderem manter-se agrupados. A estrutura de dados mais utilizada para representar
as divises na imagem so as rvores do tipo quadtree, que divide sempre a imagem em quatro
partes iguais. Aps uma diviso, caso a condio de similaridade no se verique para todas as
2.2. Fundamentos para o Processamento e Anlise de Imagens 25
Imagem Original Imagem Segmentada
Figura 2.21: Processo de segmentao por crescimento de regies.
Fonte: http://www.comp.leeds.ac.uk/ai21/examples/images/rgrow.html
partes separadas, cada parte prossegue sendo dividida obedecendo esta mesma estrutura at atingir
diversas regies, que reunidas formam a imagem completa.
Quando no h mais possibilidade de realizar divises, ou seja, todas as divises j formam
regies distintas, inicia-se o processo de agrupamento das regies vizinhas que atendam ao mesmo
critrio de similaridade de agrupamento dos pontos, para realmente formar um grupo de regies
maiores que caracterizem de maneira mais visvel as diferentes informaes da imagem. O proce-
dimento termina quando no mais possvel agrupar nenhuma regio da imagem. O processo de
segmentao por diviso e agrupamento ilustrado na gura 2.22.
Segmentao por Divisores de gua (Watersheds)
A segmentao por divisores de gua abrange conceitos de todas as demais tcnicas de seg-
mentao para realizar a diviso da imagem em partes distintas. O nome dado tcnica provm do
seu princpio de funcionamento, que consiste em visualizar qualquer imagem em uma representa-
o tri-dimensional da mesma, considerando as coordenadas espaciais x e y nos planos horizontal
e vertical, respectivamente, e ainda o nvel de intensidade luminosa dos pontos nestas coordenadas
no plano perpendicular aos demais, provendo a idia de profundidade na imagem.
De acordo com esta representao topogrca da imagem, consideram-se trs elementos:
(a) pontos da imagem que pertenam a um mnimo local, (b) pontos intermedirios, em que se
colocada uma gota dgua sobre o ponto, esta escorreria em direo de um mnimo local, e (c)
pontos que pertenam a mximos locais, nos quais, se colocada uma gota dgua sobre o ponto,
a gota teria a possibilidade de escorrer para mais de um mnimo local. Os pontos que satisfa-
zem a condio (b) na imagem so chamados de represa ou divisores de guas. J os pontos que
2.2. Fundamentos para o Processamento e Anlise de Imagens 26
Imagem Original Processo de Diviso da Imagem
Imagem Segmentada Estrutura de armazenamento Quadtree
Figura 2.22: Processo de segmentao por diviso e agrupamento.
satisfazem a condio (c) so chamados de linhas divisrias de guas, e o algoritmo est interes-
sado justamente em encontrar estas linhas divisrias, pois elas limitam e representam as bordas de
objetos na imagem.
O algoritmo funciona da seguinte maneira: primeiramente, supe-se que junto aos pontos
de mnimo local (em geral pontos de baixa intensidade luminosa) abrem-se tubulaes para que
gua possa adentrar em uma taxa constante. Enquanto a gua no atinge algum ponto de mximo
local, ou seja, no consegue escape e no vasa para outra regio, ela continua entrando e cobrindo
a regio, sendo limitada pelos pontos divisores de gua. No momento em que algum ponto de
mximo local alcanado e a gua esta prxima de vazar e unir duas regies distintas, construdo
uma barragem para impedir esta unio. Haver um momento em que em todos os pontos de
mximo local ser construda esta barragem, e apenas o topo desta barragem mantm-se visvel
junto s guas. Neste momento o algoritmo para, pois estes pontos que correspondem barragem
so as linhas divisrias de guas, que representam as bordas dos objetos na imagem.
O processo de diviso de guas ilustrado na gura 2.23. Em geral este algoritmo apli-
cado para a extrao e separao de objetos de caractersticas ligeiramente uniformes do fundo da
2.3. Aplicaes 27
Imagem Original Levantamento da represa Linhas Divisrias de guas
Figura 2.23: Processo de segmentao por divisores de guas.
Fonte: http://www.reindeergraphics.com/tutorial/chap6/binary04.html
imagem. muito comum inclusive aplicar este tipo de algoritmo ao gradiente das imagens, ao
invs delas prprias, pois isto facilita a identicao de regies de baixos valores de gradiente.
2.3 Aplicaes
As reas de sistemas de viso e processamento de imagens so muito extensas e baseiam-se
em diversas reas do conhecimento, o que lhes garante grande exibilidade de solues e aplica-
es em diferentes meios. Inmeras reas de aplicao podem ser mencionadas [2, 11, 15, 20, 22]:
Controle de Qualidade: rgido monitoramento sobre caractersticas particulares de produtos in-
dustriais, procurando evitar o contato de produtos defeituosos com o mercado consumidor.
Exemplos: vericao de nmeros de lote, lacres, rtulos, referncias e datas de validade
em embalagens, inspeo de placas de circuitos impressos, inspeo de ampolas e compri-
midos.
Controle de Processos Industriais: manipulao de peas emlinhas industriais e monitoramento
de parmetros fundamentais para o bom desempenho de processos industriais, visando rea-
limentar o sistema corrigindo estes parmetros quando necessrio. Exemplos: alinhamento
de peas em linhas automotivas, orientao de robs de solda, pintura ou manipuladores,
monitoramento de parmetros de corte em processos de usinagem.
Rastreabilidade: localizao e reconhecimento de informaes codicadas sobre a superfcie de
produtos. Exemplos: leitura de cdigos de barras, localizao e leitura de cdigos bidimen-
sionais em linhas de montagem, identicao de toras na indstria madeireira.
Segurana: certicao de permisses e monitoramento de ambientes. Exemplos: inspeo de
bagagens por raios-X, reconhecimento de ris e impresses digitais, leitura de placas de
automveis, monitoramento inteligente de ambientes por deteco de movimento.
2.3. Aplicaes 28
Geograa e Metereologia: anlise de imagens de satlite. Exemplos: previses meteorolgi-
cas e fenmenos naturais, inspeo de reas de preservao ambiental, medies de reas
territoriais.
Astronomia: anlise de imagens espaciais. Exemplos: anlise da composio fsica de estrelas,
cometas e planetas, criao do modelo de constelaes e galxias.
Militar: inspeo de ambientes em condies desfavorveis ao olho humano. Exemplos: mdu-
los pticos de visualizao noturna baseados em imagens de calor.
Controle de Trfego: anlise e controle de trfego rodovirio para manter um uxo normal de
automveis. Exemplos: controle de redes de semforos e criao de desvios inteligentes e
informaes de alerta em autovias atravs da anlise do uxo automotivo.
Anlise de Imagens Mdicas: auxlio na identicao de diagnsticos e doenas. Exemplos:
tomograa cerebral, inspeo da estrutura ssea por raios-X, controle do crescimento e
sade de bebs, sondas para anlise internas de rgos do corpo humano.
Escritrio e Lazer: dispositivos e sistemas para ampliar a comunicao e armazenamento de in-
formaes. Exemplos: videoconferncias, escaneamento de imagens e textos (OCR/OCV),
controle de sistemas computacionais para decientes fsicos.
A gura 2.24 ilustra exemplos de aplicao em cada uma das reas previamente citadas.
2.3. Aplicaes 29
Controle de Qualidade Controle de Processo Industrial Rastreabilidade
Controle de Trfego Inspeo de reas Geogrcas Astronomia
Militar: Viso Noturna Segurana de Ambientes Escritrio e Lazer
Imagens Mdicas Reconhecimento de Digitais Previses Metereolgicas
Figura 2.24: Diversas reas de aplicao das tecnologias de viso e processamento de imagens.
Captulo 3
Concluses
Neste mini-curso apresentou-se uma breve viso sobre algumas tcnicas de processamento
e anlise de imagens, que envolvem distintas reas de pesquisa e aplicao, no sendo possvel
neste mini-curso esgotar a discusso.
A maioria das disciplinas de graduao, seja em engenharia, cincias da computao ou
cincias exatas, aborda o tpico de processamento de imagens em uma disciplina de fundamentos
e outra de tcnicas avanadas. E como observou-se neste mini-curso, a temtica de processamento
de imagens faz parte tambm dos estudos nas reas de viso computacional e sistemas de viso.
Discutiu-se aqui uma introduo ao tema de processamento e anlise de imagens, funda-
mentos, conceitos e terminologia, seguido de uma breve descrio das etapas de processamento
na primeira parte do mini-curso. Em um segundo momento destacou-se alguns fundamentos do
processamento de imagens no domnio espacial, morfologia matemtica e segmentao. Por m,
uma srie de aplicaes usando viso e processamento de imagens foram apresentadas, demons-
trando a importncia e crescimento das pesquisas recentes nestas reas. H um grande potencial
de aplicao da tecnologia de viso articial nas reas de medicina (ecocardigramas, radiograas,
ultra-sonograas), meteorologia (imagens de satlite, imagens de radar), ferramentas de multi-
mdia, internet, controle de qualidade, metrologia, dentre outras, que evidenciam uma curva de
desenvolvimento crescente neste mbito.
Este mini-curso traz como contribuio para os participantes uma oportunidade de ampliar
seu conhecimento na rea de viso e como ela pode ser aplicada em sistemas de automao de pro-
cessos. A literatura desta rea riqussima e recomenda-se aos interessados realizar uma pesquisa
bibliogrca mais profunda, iniciando pelas obras referenciadas ao m deste documento.
Captulo 4
Informaes Gerais
Maiores informaes, exemplos prticos, ferramentas e tcnicas na rea de sistemas de
viso podem ser encontradas nas referncias bibliogrcas deste documento e no prprio stio do
grupo S2i
1
Sistemas Industriais Inteligentes do Departamento de Automao e Sistemas da
Universidade Federal de Santa Catarina.
Outras fontes de informao so alguns stios especializados na rea de processamento de
imagens, como por exemplo:
http://www.imageprocessingplace.com/
http://www.ph.tn.tudelft.nl/Courses/FIP/frames/fip.html
http://pharyngula.org/~pzmyers/MyersLab/imaging/ip/
http://www.reindeergraphics.com/tutorial/index.shtml
http://www.mellesgriot.com/products/machinevision/machinetutorial.asp
http://machinevision.mellesgriot.com/machinevision_guide.asp
http://www.edmundoptics.com/techSupport/DisplayCategory.cfm?categoryid=18
http://www-cgi.cs.cmu.edu/afs/cs/project/cil/ftp/html/vision.html
http://homepages.inf.ed.ac.uk/rbf/CVonline/
http://homepages.inf.ed.ac.uk/rbf/HIPR2/
http://homepages.inf.ed.ac.uk/rbf/HIPR2/biblio.htm
http://iris.usc.edu/Vision-Notes/bibliography/contents.html
1
http://s2i.das.ufsc.br/
32
http://homepages.inf.ed.ac.uk/rbf/CVonline/books.htm
http://www.cs.cmu.edu/afs/cs.cmu.edu/project/cil/www/txtv-groups.html
http://sipi.usc.edu/database/
http://virtual.lncc.br/
http://www.cbpf.br/cat/pdsi
Uma forma de adquirir conhecimento prtico na rea de processamento e anlise de imagens
estudar e utilizar as funcionalidades da biblioteca computacional OPENCV. Esta biblioteca
estruturada na linguagem C e foi desenvolvida inicialmente pela Intel
2
, que no princpio abriu
seu cdigo e liberou sua utilizao sem restries. Posteriormente a Intel elaborou uma srie de
modicaes na biblioteca, criando novos mdulos para que esta rodasse de forma otimizada em
seus microprocessadores, fechando o novo cdigo produzido. A parte do cdigo da OPENCV que
permaneceu livre passou a ser administrada pela comunidade de desenvolvedores de software da
rea. Toda a documentao, cdigo fonte e exemplos de aplicao pode ser baixados do stio
3
do
projeto na internet. Outras informaes sobre a biblioteca podem ser ainda encontradas em:
http://sourceforge.net/projects/opencvucl
http://sourceforge.net/projects/fsight
http://sourceforge.net/projects/s2ilib
Este assunto no esgota-se com este mini-curso, pelo contrrio, este apenas o comeo. O
objetivo aqui despertar o interesse pelo tema ou consolidar o desejo de pesquisar e aprender mais
sobre processamento e anlise de imagens.
Contato:
Alberto Xavier Pavim (axpavim@das.ufsc.br)
Mrio Lucio Roloff (roloff@das.ufsc.br)
Correspondncia:
A/C: Prof. Dr. -Ing. Marcelo Ricardo Stemmer
Sistemas Industriais Inteligentes - S2i
Departamento de Automao e Sistemas - DAS
Centro Tecnolgico - CTC
Universidade Federal de Santa Catarina - UFSC
Caixa Postal 476 - Campus Universitrio
CEP 88040-900 Trindade Fpolis - SC - Brasil
2
http://www.intel.com/research/mrl/research/opencv/
3
http://sourceforge.net/projects/opencvlibrary/
Referncias Bibliogrcas
[1] Eduardo Pigozzi Cabral, Fernando Deschamps, and Marcelo Ricardo Stemmer. Algumas
Aplicaes da Transformada Discreta de Fourier no Processamento Digital de Imagens. In
Anais do II Simpsio Catarinense de Processamento Digital de Imagens - SCPDI, volume 1,
Florianpolis - SC - Brasil, 2002.
[2] E. R. Davies. Machine Vision - Theory Algorithms Practicalities. Elsevier - Morgan Kauf-
mann, 3 edition, 2005.
[3] Fernando Deschamps. Contribuies para o Desenvolvimento de um Sistema de Viso apli-
cado ao Monitoramento do Desgaste de Ferramentas de Corte - O Sistema ToolSpy, 2004.
[4] A. Erhardt-Ferron. Theory and Applications of Digital Image Processing. University of
Applied Sciences Offenburg, 1 edition, 2000.
[5] David A. Forsyth and Jean Ponce. Computer Vision: A Modern Approach. Prentice Hall, 1
edition, 2002.
[6] Rafael C. Gonzalez and Richard E. Woods. Digital Image Processing. Pearson Education, 2
edition, 2002.
[7] Ramesh Jain, Rangachar Kasturi, and Brian G. Schunck. Machine Vision. McGraw Hill, 1
edition, 1995.
[8] Bernd Jhne. Digitale Bildverarbeitung. Springer, Alemanha, 4 edition, 1997.
[9] Bernd Jhne, Horst Haussecker, and Peter Geissler. Handbook of Computer Vision and
Applications - Sensors and Imaging, volume 1. Academic Press, San Diego - CA, 1 edition,
1999.
[10] Bernd Jhne, Horst Haussecker, and Peter Geissler. Handbook of Computer Vision and
Applications - Signal Processing and Pattern Recognition, volume 2. Academic Press, San
Diego - CA, 1 edition, 1999.
REFERNCIAS BIBLIOGRFICAS 34
[11] Bernd Jhne, Horst Haussecker, and Peter Geissler. Handbook of Computer Vision and
Applications - Systems and Applications, volume 3. Academic Press, San Diego - CA, 1
edition, 1999.
[12] Erwin Kreyszig. Advanced Engineering Mathematics. John Wiley and Sons, Estados Unidos,
8 edition, 1999.
[13] Alan V. Oppenheim, Alan S. Willsky, and S. Hamid Nawab. Signals and Systems. Prentice
Hall, Estados Unidos, 2 edition, 1997.
[14] J. R. Parker. Algorithms for Image Processing and Computer Vision. Wiley, Estados Unidos,
1 edition, 1996.
[15] Alberto Xavier Pavim. Seminrio em Sistemas de Viso: Aplicaes no Controle de Quali-
dade e Rastreabilidade. 2002.
[16] Alberto Xavier Pavim. Contribuies na Otimizao de um Sistema de Viso para Deteco,
Medio e Classicao Automtica do Desgaste de Ferramentas de Corte em Processos de
Usinagem, 2005.
[17] William K. Pratt. Digital Image Processing: PIKS Inside. John Wiley and Sons, Estados
Unidos, 3 edition, 2001.
[18] Gerhard X. Ritter and Joseph N. Wilson. Handbook of Computer Vision Algorithms in Image
Algebra. CRC Press, 1 edition, 1996.
[19] John C. Russ. The Image Processing Handbook. CRC Press - IEEE Press, 3 edition, 1998.
[20] S. J. Sangwine and R. E. N. Horne. The Colour Image Processing Handbook. Chapman and
Hall, 1 edition, 1998.
[21] Michael Seul, Lawrence OGorman, and Michael J. Sammon. Practical Algorithms for
Image Analysis - Description, Examples, and Code. Cambridge, Estados Unidos, 1 edition,
2001.
[22] Linda Shapiro and George Stockman. Computer Vision. Prentice Hall, 1 edition, 2000.
[23] Milan Sonka, Vaclav Hlavac, and Roger Boyle. Image Processing, Analysis, and Machine
Vision. PWS Publishing, Estados Unidos, 2 edition, 1998.

You might also like