Localização e Segmentação de Placas para Identificação Automática de Veículos

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS
Instituto de Informática
LOCALIZAÇÃO E SEGMENTAÇÃO
DE PLACAS PARA IDENTIFICAÇÃO
AUTOMÁTICA DE VEÍCULOS
Júlio César e Melo
Belo Horizonte
2004
LOCALIZAÇÃO E SEGMENTAÇÃO
DE PLACAS PARA IDENTIFICAÇÃO
AUTOMÁTICA DE VEÍCULOS
Trabalho de diplomação apresentado ao Curso de

Bacharelado em Sistemas de Informação, da Pon-
tifı́cia Universidade Católica de Minas Gerais.
Orientador: Prof. Silvio Jamil Ferzoli Guimarães.
Belo Horizonte
ii

Localização e Segmentação de Placas para Identificação Automática de
Veı́culos
Trabalho de diplomação apresentado ao Curso de Bacharelado em Sistemas de Informação,
da Pontifı́cia Universidade Católica de Minas Gerais.
Belo Horizonte, 2004.
Prof. Silvio Jamil Ferzoli Guimarães (Orientador)

Pontifı́cia Universidade Católica de Minas Gerais
Profa. Rosilane Ribeiro da Mota

Profa. Fátima de Lima Procópio Duarte Figueiredo

iv
“Alea jacta est!”
Júlio Cæsar
46 A.C.
v
Resumo
A identificação automática de veı́culos depende da localização da(s) placa(s)
do(s) respectivo(s) veı́culo(s) na imagem digital, da segmentação de seus caracteres
e do sistema de reconhecimento de caracteres. Variações na imagem proporcionadas
por diversidade climática, ambiental e danificações mecânicas na placa, ademais da
sobreposição da placa por outros objetos na imagem, dificultam o processo de iden-
tificação. Neste trabalho, propõe-se uma adaptação de uma técnica de localização
de placa, reduzindo as ocorrências de falsos-positivos, e a adoção de uma técnica de
segmentação, utilizando árvore de componentes conexos para localizar e segmentar
os caracteres da placa. Esta última mostra-se robusta em relação aos problemas
tradicionais da literatura, como rotação da placa, porém apresenta dificuldade para
identificar placas com iluminação não-uniforme.

vi
Lista de Figuras
1 Processo de reconhecimento de placa a partir de uma imagem . . . . . . . 10

2 Componente conexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3 Representação da árvore de componentes conexos . . . . . . . . . . . . . . 13
4 Exemplo de filtragem da árvore de componentes conexos . . . . . . . . . . 13
5 Comparação do perfil de linha que corta a região da placa . . . . . . . . . 14
6 Aplicação do operador morfológico black top-hat sobre imagem contendo
placa de veı́culo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
7 Diferenciação da abertura e do fechamento sobre imagem contendo placa
de veı́culo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
8 Pares de pontos máximos pmax
i e mı́nimos pmin
i consecutivos . . . . . . . . 20
9 Número máximo de pares na assinatura é igual ao dobro do número de
caracteres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
10 “Assinaturas” da placa em diferentes contrastes . . . . . . . . . . . . . . . 22
11 Distância entre intervalos na linha demarcada . . . . . . . . . . . . . . . . 24
12 “Assinaturas” sobre o perfil de linha modificado por transformações mor-
fológicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
13 Árvore de componentes conexos simplificicada de uma placa de veı́culo . . 26
14 Árvore de componentes conexos fictı́cia, porém semelhante à encontrada
na região das placas com pequenas variações de tonalidades . . . . . . . . . 26
15 Localização da placa na árvore de componentes conexos . . . . . . . . . . . 27
16 Reta traçada pela regressão linear para verificar o alinhamento dos carac-
teres em uma placa um pouco inclinada . . . . . . . . . . . . . . . . . . . . 28
17 Análise de assinatura em imagem em condições irregulares . . . . . . . . . 31
18 Iluminação não-uniforme prejudica a identificação da placa . . . . . . . . . 32
19 Placas segmentadas corretamente utilizando árvore de componentes conexos 33
vii
Lista de Tabelas
1 Ocorrências de falsos-positivos e placas encontradas nos testes realizados . 29

2 Resultados obtidos na identificação da “assinatura” em teste realizado em
um conjunto de fotos em condições irregulares . . . . . . . . . . . . . . . . 30
viii
Sumário
1 Introdução 9
2 Revisão Bibliográfica 11
2.1 Bibliografia básica de processamento de imagens . . . . . . . . . . . . . . . 11
2.1.1 Morfologia matemática . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.1.2 Árvore de componentes conexos . . . . . . . . . . . . . . . . . . . . 12
2.2 Técnicas de localização e segmentação de placas . . . . . . . . . . . . . . . 14
2.2.1 Localização da placa baseada em sua assinatura . . . . . . . . . . . 14
2.2.2 Segmentação de placa utilizando black top-hat . . . . . . . . . . . . 15
2.2.3 Segmentação de placa utilizando diferença de abertura e fechamento 16
2.2.4 Segmentação de placa utilizando componentes conexos . . . . . . . 18
3 Objetivo 19
4 Metodologia 19
4.1 Aprimoramento da localização de placa verificando sua assinatura . . . . . 19
4.1.1 Análise do perfil de linha . . . . . . . . . . . . . . . . . . . . . . . . 20
4.1.2 Transformação morfológica do perfil de linha . . . . . . . . . . . . . 24
4.2 Segmentação de placa utilizando árvore de componentes conexos . . . . . . 25
4.2.1 Representação da placa na árvore de componentes . . . . . . . . . . 25
4.2.2 Localização da placa . . . . . . . . . . . . . . . . . . . . . . . . . . 27
5 Resultados 29
5.1 Resultados obtidos para o aprimoramento da localização de placa verifi-
cando sua assinatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
5.2 Resultados obtidos para a segmentação de placa utilizando árvore de com-
ponentes conexos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
6 Conclusão 32
9
1 Introdução
A identificação de veı́culos é uma tarefa observada em todos ambientes em que

se deseja ter um controle de segurança, acesso ou monitoramento. Esta identificação
normalmente é realizada observando-se as placas dos veı́culos, que correspondem a seu
identificador único. Tal prática é facilmente executada manualmente em ambientes onde
o veı́culo pára ou se move lentamente, para que um responsável pela identificação do
mesmo possa anotar a sua placa, como ocorre em guaritas ou em fotos de radares, cuja
imagem é estática. Contudo, a identificação manual se torna inviável em vias de grande
circulação, como em avenidas e rodovias, onde o trânsito é praticamente ininterrupto e
rápido, e ainda em locais que demandam rapidez para a anotação das placas.
Um sistema de identificação automática em tempo-real permitiria a fiscalização
e o monitoramento de vias de trânsito intenso, sem a redução de sua vazão. Além de
facilitar a fiscalização e o controle de entrada de veı́culos em áreas cujo acesso seja restrito,
tal sistema possibilitaria a análise do comportamento de um motorista, desde que haja
pontos distribuı́dos de identificação. Verificando a passagem de um veı́culo por diversos
pontos da cidade, torna-se possı́vel traçar sua trajetória aproximada para chegar de um
ponto a outro. A análise estatı́stica de trajetórias permitiria, por exemplo, a avaliação
de novas sinalizações de trânsito, a fim de otimizar o caminho realizado pelos motoristas,
minimizando a saturação de vias comumente utilizadas.
Entretanto, alguns fatores podem dificultar a identificação automática de veı́culos
por meio de processamento digital da imagem da placa:
• O sistema está sujeito a obter imagens com variações de luminosidade ou climática,

como chuva ou neve;
• Danificações mecânicas podem impedir a visualização completa da placa;
• No Brasil, existem placas em uma ou duas linhas e em diferentes combinações de

cores, conforme licença do veı́culo;
• As placas podem estar inclinadas ou parcialmente ocultas.

10
O sistema de reconhecimento de placas, que identifica um veı́culo, pode ser divi-

dido em quatro etapas (Fig. 1): aquisição da imagem contendo a placa do veı́culo, sua
localização, segmentação de seus caracteres e reconhecimento deles.
Figura 1: Processo de reconhecimento de placa a partir de uma imagem.
Após adquirida a imagem a ser processada, o primeiro desafio é definir nela a(s)
posição(ões) da(s) placa(s) do(s) veı́culo(s). Uma imagem pode conter desde nenhuma a
várias placas. A identificação precisa das regiões da imagem que contém alguma placa é
essencial para um bom desempenho dos passos seguintes. Por outro lado, a não identi-
ficação destas regiões implica em um insucesso do sistema como um todo.
Para esta etapa, foram propostas técnicas que realizam varredura vertical na ima-
gem, procurando por caracterı́sticas tonais comuns das placas [1, 2, 3], e, também, var-
redura utilizando células autômatas [4], possibilitando o processamento distribuı́do da
imagem. Estas técnicas são eficientes, porém não eficazes diante das variações de pers-
pectiva da câmera ou das inclinações da placa.
Outras técnicas mais flexı́veis a tais variações utilizam morfologia matemática como
base de seus algoritmos de localização [5, 6]. Estas, porém, apresentam um custo compu-
tacional maior, devido à presença de uma série de operações morfológicas utilizadas em
cada imagem adquirida, e restrições quanto ao tamanho relativo da placa e, conseqüente-
mente, à distância do veı́culo em relação à câmera.
Alternativas mais genéricas foram propostas utilizando detecção de bordas colo-
ridas [7], considerando a padronização de cores das placas, e análise de componentes
conexos [3], em que cada componente conexo a um outro maior é análogo ao caracter
sobre o fundo da placa.
A terceira etapa - segmentação dos caracteres - tem como finalidade separar cada
caracter para ser posteriormente reconhecido individualmente. Muitas técnicas verificam
11
uma grande ou total diminuição da projeção vertical na região da placa [4, 1, 3, 5].
Técnicas de localização baseadas em análise de componentes conexos [3] possibilitam a
execução de ambas as fases em um único processamento.
A etapa final - reconhecimento dos caracteres - depende da correta segmentação
de caracteres e pode ser realizada utilizando redes neurais [8]. Esta etapa, no entanto,
não é objeto de estudo deste trabalho.
O conteúdo deste trabalho encontra-se dividido da seguinte maneira: na Seção 2
é realizada uma revisão bibliográfica, onde são abordadas técnicas de processamento de
imagens, relacionadas às técnicas desenvolvidas, e técnicas já existentes de localização
e segmentação de placas de veı́culos; na Seção 3 é apresentado o objetivo do trabalho;
na Seção 4 são descritos o aprimoramento realizado na técnica de localização de placas
verificando suas “assinaturas” [1] e uma nova técnica desenvolvida utilizando árvore de
componentes conexos [9]. Em seguida, na Seção 5 são apresentados os resultados de ambas
técnicas trabalhadas. Por fim, na Seção 6 é apresentada a conclusão do trabalho.
2 Revisão Bibliográfica
2.1 Bibliografia básica de processamento de imagens
Para a compreensão das técnicas de localização e segmentação de placas, é ne-

cessário, antes, a compreensão das técnicas de morfologia matemática [10, 11, 12] e árvore
de componentes conexos [9], descritas a seguir.
2.1.1 Morfologia matemática
Algoritmos de localização de placa baseados em cores remete a um problema tı́pico

de variações climáticas e ambientais. Uma abordagem baseada em morfologia matemática
[10, 11, 12] pode tornar o algoritmo de localização mais tolerante a tais variações [6].
A principal consideração que as técnicas de localização da placa utilizam é que,
como as placas de veı́culos são compostas por caracteres contrastantes com o fundo, elas
podem ser segmentadas utilizando combinações de operações de abertura e fechamento,
12
como serão descritas a seguir:
Abertura: I ◦ S = (I ⊕ S) S
Fechamento: I • S = (I S) ⊕ S
onde I denota a imagem a ser processada, ⊕ a dilatação e a erosão, dado o elemento

estruturante S (vide [10, 11, 12] para maiores detalhes).
2.1.2 Árvore de componentes conexos
Uma imagem em tons de cinza pode ser transformada em uma árvore de compo-
nentes conexos [9], permitindo filtragens e segmentação da imagem. Antes de definir uma
árvore de componentes conexos, é necessário conhecer a definição de componente conexo.
Considerando a imagem binária na Fig. 2, a região preta é um componente conexo
formalmente definido por um conjunto de pontos conectados entre si por pixels vizinhos
de mesma coloração.
Figura 2: Um componente conexo de cor preta.
Em uma imagem em tons de cinza (Fig. 3), cada “componente conexo” pode ser
delimitado em um nó da árvore. Nela, o nı́vel em que se encontra o nó determina a sua
tonalidade cinza. Toda folha, em uma imagem com pelo menos um componente conexo,
se encontra totalmente dentro da área de um componente conexo de um tom em um nı́vel
inferior. Já os nós internos situados a um nı́vel i, além de estarem conectados por pixels
de tonalidade i, estão também conectados por pixels de tonalidades maiores que i. Desta
maneira, a raı́z, por possuir o menor nı́vel da árvore, abrange toda a imagem.
Com esta representação, é possı́vel obter mais componentes contidos em nós que
componentes conexos extraı́dos da imagem original plana em seu conceito original, pois
para um componente conexo em um nı́vel x > 0, necessariamente existe outro em um nı́vel
13
x − 1 da árvore, enquanto na imagem original nı́veis de cinza diferentes apenas separam

os componentes.
A estruturação da imagem em árvore permite transformações simples a partir de
filtragem de componentes. Como ilustrado na Fig. 4, a partir de um nó pode-se, por
exemplo, filtrar aqueles componentes que não pertencerem ao caminho do nó escolhido
até a raiz. Para filtragens mais elaboradas, pode-se agregar ao nó informações, como área
e região.
(a) (b) (c)
Figura 3: Representação de uma imagem em tons cinzas (a) em forma tridimensional

(b) e utilizando árvore de componentes conexos (c). Para estas imagens, considere a
graduação da cor branca no nı́vel inferior crescendo para a cor preta em um nı́vel superior,
analogamente ao negativo da representação computacional dos respectivos tons.
(a) (b) (c)
Figura 4: Exemplo de filtragem da árvore de componentes conexos da Fig. 3. Os compo-

nentes selecionados (a) foram segmentados (b, c).
14
2.2 Técnicas de localização e segmentação de placas
2.2.1 Localização da placa baseada em sua assinatura
Inicialmente proposta por Barroso et al [1], a técnica de localização pela “assina-

tura” da placa se baseia na variação de tonalidades nas linhas da imagem que cortam os
caracteres da placa. Esta caracterı́stica, denominada “assinatura”, possui intervalos regu-
lares propiciados pelo contraste entre as letras e o fundo da placa, podendo ser identificada
analisando perfis de linha (Figura 5).
Figura 5: Perfil de linha que corta região da placa (2) comparada a um perfil de linha de
uma região qualquer (1).
Para tanto, realiza-se uma varredura nas linhas da imagem até encontrar tais
intervalos. A identificação é feita por meio de análise no domı́nio espacial, comparando
os pontos máximos e mı́nimos consecutivos com certas caracterı́sticas pré-definidas, como
número, distância relativa e amplitude dos pontos. Os autores [1] sugerem o uso de
informações estatı́sticas para a escolha de tais caracterı́sticas, porém não explicitam os
critérios de avaliação de tais pontos máximos e mı́nimos.
Em seguida, visando precisar melhor a localização, utilizam-se projeções verticais
e horizontais numa versão binarizada da imagem. Sugere-se o uso de um limiar dinâmico,
conforme nı́veis máximos e mı́nimos obtidos na linha anteriormente analisada, para de-
terminar a localização de acordo com as projeções.
Apesar da simplicidade teórica do algoritmo, há uma dificuldade para determinar
quais máximos e mı́nimos são relevantes para a identificação da assinatura. A presença de
elementos com variação de luminância, como reflexos nos vidros do veı́culo, por exemplo,
diminuem a eficácia da técnica, pois apresentam o mesmo padrão que a assinatura da
placa no perfil de linha. Este problema, no entanto, pode ser minimizado utilizando o
15
operador Sobel antes da varredura [2]. O operador realça os pontos da linha que possuem
grande contraste, facilitando a identificação correta da assinatura ao minimizar os picos
de baixo contraste.
A cor da placa também pode influenciar o resultado final do algoritmo, conforme
caracterı́sticas escolhidas para análise. Como a largura entre os pontos máximos e mı́nimos
na região da placa corresponde à largura do caracter, placas com letras pretas em fundo
branco possuem uma largura entre os pontos máximos e mı́nimos menores que placas
com letras brancas em fundo preto. A assinatura, neste caso, obtém uma inversão de suas
caracterı́sticas, dificultando a sua identificação em pares que utilizam mais de um padrão
de cores de placa, como ocorre no Brasil.
O desempenho do algoritmo pode ser otimizado quando a imagem compreende um
único veı́culo em uma posição normalmente centralizada, como ocorre em fotos de radares
fixos que são tiradas quando o veı́culo passa sobre um sensor na pista. Nestas imagens,
a varredura pode ser realizada na direção de baixo para cima em intervalos regulares
menores que a altura esperada de uma placa, conforme trabalho realizado por Souza [2],
já que a placa se encontra na região inferior da foto e o tamanho é normalmente o mesmo,
permitindo, então, a definição prévia de um intervalo mı́nimo para a varredura.
2.2.2 Segmentação de placa utilizando black top-hat
Martı́n e Borges [5] utilizaram as transformações morfológicas (Seção 2.1.1) black

top-hat (também chamado de bottom-hat ou “chapéu mexicano”), white top-hat e fecha-
mento para localizar a placa em uma imagem de tons cinzas. Tais operações são definidas
a seguir:
Black Top-Hat: b(I) = (I • S) − I
White Top-Hat: w(I) = I − (I ◦ S)
Considerando que os caracteres da placa são elementos negros e finos dentro de um

fundo branco, eles podem ser realçados utilizando a transformação black top-hat. Para
placas cujas cores estão invertidas, caracteres brancos em fundo preto, a transformação
a ser utilizada deve ser a white top-hat. O elemento estruturante S sugerido para a
16
segmentação da placa possui uma forma circular.

Em seguida, o resultado da transformação é binarizado e a imagem resultante
sofre transformação de fechamento, utilizando um elemento estruturante na forma de
uma linha horizontal, cujo tamanho é maior que o espaçamento entre os caracteres. Esta
transformação resulta em regiões retangulares candidatas a placa (Fig. 6c).
(a) (b) (c)
Figura 6: Aplicação do operador morfológico black top-hat na imagem (a) com resultado
em (b). A imagem é binarizada utilizando um limiar e então sofre fechamento, obtendo
as regiões candidatas a placas em (c), destacadas com a cor verde.
As placas que contém duas linhas, cada uma delas encontra-se separada em dois
retângulos brancos distintos. Para uni-los, basta dilatar ambas regiões, obtendo então a
região total da placa.
Este algoritmo depende de caracterı́sticas pré-definidas, perdendo sua eficácia com
variações na distância do veı́culo em relação à câmera, devido à necessidade de adequação
do tamanho do elemento estruturante. Para o tratamento de placas em dois padrões de
cores diferentes, como preto no branco e branco no preto, o algoritmo requer dois conjuntos
de combinações de operações morfológicas, black top-hat e white top-hat, respectivamente,
acarretando em um pior desempenho para a identificação da placa. Hsieh, Yu e Chen [6]
propõem um algoritmo, também baseado em morfologia matemática, que não requer essa
adaptação para diferentes cores de placa (Seção 2.2.3).
2.2.3 Segmentação de placa utilizando diferença de abertura e fechamento
Uma técnica tolerante à inversão de cores da placa é proposta por Hsieh, Yu e

Chen [6]. A partir do resultado de (I • S7,1 ) − (I ◦ S7,1 ), em que Sw,h denota um elemento
estruturante retangular de largura w e altura h, é possı́vel obter as bordas verticais dos
17
caracteres da placa (Fig. 7b). Como os caracteres possuem suas bordas adjacentes e
próximas uma das outras, é possı́vel conectar a região de cada um utilizando a operação
I •S1,7 , formando a região candidata a placa. O resultado é limiarizado para então rotular
cada região remanescente (Fig. 7c).
(a) (b) (c)
Figura 7: Resultado da operação de diferenciação da abertura e do fechamento. A imagem

original (a) sofre detecção de bordas verticais (b), fechamento e então é limiarizado,
obtendo as regiões candidatas a placas (c), destacadas com a cor verde.
O resultado obtido pode conter elementos que não pertencem à placa. Tais ele-
mentos são filtrados observando a sua densidade - calculada como A/(w × h), onde A é
a área do elemento, w a largura e h a altura -, a proporção entre largura e altura e o
tamanho da região (regiões muito pequenas são desconsideradas).
As regiões podem ainda conter placas cortadas, necessitando, portanto, de um
processo de reconstrução. Primeiramente, calcula-se a média da largura, wc , e da altura,
hc , dos possı́veis caracteres inseridos na região. Adotando-se um limiar para similaridade
entre o tamanho dos caracteres e o tamanho médio, conta-se o número de caracteres nc
segmentados. Caso ele seja inferior à quantidade padrão np de uma placa, a região tem
seus limites horizontais aumentados em (np −nc )×wc pontos. Se ainda algum ponto tocar
os limites verticais, distancia-se hc /5 unidades o limite tocado, proporção esta arbitrada
pelos autores. Ocorrendo qualquer alteração em seu tamanho, a região é novamente
binarizada, passando por todos os passos anteriores.
Assim como o algoritmo de Martı́n e Borges [5], o algoritmo de Hsieh, Yu e Chen [6]
falha se a distância entre os caracteres ultrapassar um valor esperado. Caso esta condição
ocorra, ambos algoritmos não conseguem conectar os caracteres segmentados para formar
a região da placa.
18
2.2.4 Segmentação de placa utilizando componentes conexos
A localização de placa utilizando análise de componentes conexos foi proposta por

Kwaśnicka e Wawrzyniak em [3]. O algoritmo consiste em construir um conjunto de
elementos que possam representar os caracteres da placa, que posteriormente sofrerão um
processo de exclusão e agrupamento até formarem a região da placa.
Inicialmente, a imagem deve ser processada e transformada no modelo de cores
YUV, porém somente a luminância é utilizada pelo algoritmo. A imagem considerada é
normalizada por algum limiar que aumente o contraste entre os caracteres e o fundo da
placa e minimize os efeitos causados pelas diferenças climáticas e ambientais.
O primeiro passo do algoritmo é binarizar a entrada, analisando a cor e o contraste
entre a vizinhança dos pontos da imagem. Para cada ponto, obtém-se a maior diferença
de brilho em sua vizinhança, representado por um quadrado de tamanho 5x5. A maior
diferença é comparada com um determinado limiar definido empiricamente, a fim de
marcar ou não o ponto na imagem binarizada. Caso este não seja marcado, adota-se
outro limiar para a tonalidade do ponto, separando assim a letra do fundo, usando cores
diferentes para cada.
Em seguida, são identificadas todas as regiões brancas e pretas, determinando seu
tamanho e sua área. Verifica-se se cada uma delas está conforme caracterı́sticas pré-
definidas, a fim de selecionar aquelas regiões que representam um único caracter. Uma
consideração a ser feita é que nenhum outro elemento da imagem esteja conectado ao
caracter na imagem, caso contrário não será possı́vel extrair informações como largura e
altura do mesmo.
As regiões selecionadas são agrupadas com os vizinhos que possuem o mesmo tama-
nho. Estes grupos, chamados de segmentos, sofrem outro processo de seleção semelhante
à seleção das regiões. Os segmentos restantes correspondem a diferentes conjuntos de ca-
racteres, mas não identificam ainda uma placa por completo. Placas de uma linha podem
estar divididas em dois segmentos paralelos verticalmente e placas de duas linhas podem
estar divididas em dois segmentos paralelos horizontalmente. Para finalmente determinar
a posição da placa, os segmentos vizinhos são também agrupados e verifica-se a quanti-
19
dade de regiões inseridas em cada grupo de segmentos. Aqueles que possuem o número
de caracteres de uma placa são considerados candidatos à localização da placa.
Com esta técnica, além de localizar a placa, os caracteres encontram-se segmenta-
dos nos componentes conexos extraı́dos da imagem.
3 Objetivo
Este trabalho objetiva:
1. Aprimorar e combinar técnicas de localização e segmentação de placas, visando:
• Desempenho suficiente para a identificação on-line do(s) veı́culo(s) presente(s)

na imagem de entrada;
• Maximização da identificação de presença de placas;
• Flexibilidade para identificação de placas em diferentes formatos (uma ou duas

linhas) e cores;
• Flexibilidade para variações nas condições ambientais e/ou climáticas;
• Tolerância a ruı́dos na imagem, inclusive àqueles propiciados por danificações

mecânicas na(s) placa(s).
2. Desenvolvimento de nova técnica de localização e segmentação da placa, utilizando

árvore de componentes conexos [9].
4 Metodologia
4.1 Aprimoramento da localização de placa verificando sua as-
sinatura1
Esta seção aborda um aprimoramento da técnica de localização de assinatura,

inicialmente proposta por Barroso et al [1] (vide Seção 2.2.1). Para a compreensão deste
1
Parte desta seção foi aceita para publicação no Workshop de Iniciação Cientı́fica do SIBGRAPI’2004
[13] e nos anais do V WTI da UFMG [14].
20
método, considere a seguinte definição para o perfil de linha Hi :
Hi = {I(i, j), ∀j ∈ [0, w]}
onde i representa a linha analisada da imagem I, j a coluna e w a largura de I.

Por meio de uma varredura vertical, analisa-se os perfis de linha para encontrar al-
guma assinatura. Basta a identificação de uma única assinatura para considerar a possı́vel
presença da placa naquela linha, porém sua localização é ainda imprecisa, necessitando
uma melhor apuração. Para isto, binariza-se a imagem, utilizando um limiar conforme
valores mı́nimos e máximos na assinatura, de forma a separá-los pela cor binarizada.
Em seguida, verificam-se projeções horizontais e verticais, afim de encontrar uma grande
variação nelas, indicando um encontro provável de bordas da placa.
Uma perspectiva inclinada entre a placa e a câmera pode dificultar a identificação
da assinatura. Como se utiliza análise do perfil de linha, todos os caracteres da placa
devem ser cortados pela linha analisada para que a identificação seja precisa. Ademais, a
presença de outros elementos contrastantes na imagem, como brita, reflexo de folhagens
nos vidros, outdoors e letreiros podem ser confundidos com a placa.
4.1.1 Análise do perfil de linha
Uma vez obtido o perfil de linha H, deve-se encontrar o conjunto P dos n pares
pi = {pmin
i , pmax
i }, em que pi é composto pelos pontos máximos pmax
i = (xmax
i , H(xmax
i ))
e mı́nimos pmin
i = (xmin
i , H(xmin
i )) consecutivos mais próximos entre si (Fig. 8), onde i
identifica o i-ésimo par.
Figura 8: Pares de pontos máximos pmax

i e mı́nimos pmin
i consecutivos.
A partir da identificação dos pontos máximos e mı́nimos, pode-se definir o conjunto

21
P , como a união dos conjuntos de pares crescentes, PC , e de pares decrescentes, PD ,

definidos por:
P = PC ∪ PD
PC = {pi |xmin
i < xmax
i }
PD = {pi |xmin
i > xmax
i }
Para cada par pi encontrado, calcula-se a amplitude ai que representa a diferença

dos valores dos pontos xmax
i e xmin
i no perfil de linha H:
ai = H(xmax
i ) − H(xmin
i )
Afim de eliminar pequenos picos propiciados por pequenas variações de luminosi-

dade ou ruı́dos na imagem, todo intervalo cujo ai seja inferior a um limiar α, definido
empiricamente, é removido de P .
A identificação da assinatura é dada analisando um subconjunto At de m pares
consecutivos:
At ⊆ P
At = (pt , pt+1 , ..., pt+m )
A determinação do valor de m influencia diretamente na flexibilidade da perspec-

tiva da placa em relação à câmera. Se a linha correspondente ao perfil estiver paralela à
placa com c caracteres, existirão pelo menos 2c pares (Fig. 9), visto que para cada carac-
ter haverá um intervalo pi e outro pi+1 , em que o primeiro contém xmin
i referente ao fundo
da placa antes do caracter e xmax
i referente ao caracter em si. O segundo intervalo contém
xmax max
i+1 maior ou igual a xi , porém diferenciado em xmin
i+1 , que é referente à placa após
o caracter, considerando fundo claro com letras escuras, conforme Fig. 10a; o contraste
inverso (Fig. 10b) acarreta em troca dos valores de xmax com xmin . Se a linha analisada
no perfil de linha não estiver paralela à placa, ela não cortará todos caracteres, obtendo
assim um número de pares inferior a 2c. Outra consideração a ser feita ao determinar o
valor de m é a existência de placas em duas linhas.
Para cada pi ∈ At , calcula-se a distância entre os pontos do par, denominada
22
Figura 9: Número máximo de pares na assinatura é igual ao dobro do número de carac-

teres.
(a) (b)
Figura 10: “Assinaturas” da placa em diferentes contrastes. A placa em (a) possui letra
escura em fundo claro e em (b) o inverso.
largura li , e a sua distância di para o par anterior pi−1 , conforme fórmulas a seguir:
li = |xmax
i − xmin
i |
di = min(xmax
i , xmin
i ) − max(xmax min
i−1 , xi−1 )
Como existem apenas duas cores na placa do veı́culo, a largura dos pares é pra-
ticamente a mesma, variando conforme degradê da borda entre o caracter e o fundo. Já
a distância auxilia na identificação do agrupamento espacial dos pares, correspondendo
à distância entre os caracteres ou à largura deles. Tais informações serão utilizadas para
identificar a “assinatura” no perfil de linha.
Para tanto, extrai-se as mediatrizes a, l, d, pmax e pmin dos valores da amplitude,
largura, distância, abscissa do pico máximo e abscissa do pico mı́nimo de todos os elemen-
tos do subconjunto A, respectivamente. Considere o valor da mediatriz de um sı́mbolo x
denominado por x = (max {x} + min {x})/2. A “assinatura” é considerada encontrada
na região analisada quando as seguintes condições forem satisfeitas:
23
|ai − a| ≤ ka × a (1)
|li − l| ≤ kl × l (2)
∀pi ∈ A, |di − d| ≤ kd × lmax (3)
|di − d| ≤ αλ × λ (4)
|pmax
i − pmax | ≤ kp × a (5)
onde ka , kl , kd e kp correspondem a constantes definidas empiricamente para os limiares

de semelhança da amplitude, largura, distância e de picos, respectivamente. lmax denota
a maior largura calculada para algum pi ∈ A. Considere λ a abrangência do conjunto,
que corresponde à diferença da maior abscissa pela menor encontrada em A, tendo seu
limiar αλ calculado por:
1 + kλ
αλ = 2 ×
n
sendo kλ uma constante de semelhança.

Os critérios de análise estabelecem uma relação entre a distância, a largura e a
abrangência do conjunto. O limiar para a distância em relação à largura mı́nima do in-
tervalo garante uma proporção dada pela distância entre os caracteres na placa e o seu
tamanho relativo na imagem, evitando assim que os intervalos se distanciem excessiva-
mente. A distância relacionada à abrangência do conjunto torna-se um pouco redundante,
porém garante a dispersão dos intervalos na região analisada.
O uso de limiares não constantes torna flexı́vel a análise das caracterı́sticas da placa
em uma imagem com diferentes tamanhos ou em placas com diferentes distâncias em
relação à câmera. Em experimentos preliminares, foram comparados valores médios com
os limiares, ao invés das mediatrizes. A média tende a se aproximar da moda encontrada
no conjunto, porém é comum encontrar valores que se diferenciam bastante da moda,
conforme ocorre com a distância entre caracteres da Fig. 11. Pode-se observar que os
valores para a distância na linha demarcada é maior entre os caracteres “7” e “9” que
de “9” para “1”. Para a caracterização da placa, a distância média não traz informação
significativa, ao passo que a mediatriz representa um referencial para os limites permitidos
da distância entre os caracteres.
24
Figura 11: Distância entre intervalos na linha demarcada: d1 > d2 .
(a) (b)
Figura 12: “Assinaturas” sobre o perfil de linha modificado por transformações mor-
fológicas.
4.1.2 Transformação morfológica do perfil de linha
Considerando que os caracteres da placa de um veı́culo são elementos finos e com

grande contraste em relação ao fundo, estes podem ser realçados utilizando a trans-
formação morfológica “black top-hat” [10, 11, 12], para placas cujo caracter seja escuro
em fundo claro, ou “white top-hat”, para placas cujo contraste seja invertido [5]:
Black Top-Hat: b(I) = (I • E) − I

White Top-Hat: w(I) = I − (I ◦ E)
Este realce pode ser utilizado no perfil de linha para auxiliar a análise da assinatura
[1] da placa (Fig. 12). Neste perfil transformado, os pequenos contrastes são suavizados
enquanto se mantém os picos na região da placa, desde que o elemento estruturante possua
uma forma horizontal e o tamanho seja maior que a largura dos caracteres, compreendido
nos di dos intervalos em que xmax
i > xmin
i do perfil de linha original de uma placa de fundo
claro e xmax
i < xmin
i para placas de fundo escuro.
Quanto menor o tamanho do elemento estruturante, menos flexı́vel o sistema se
torna às variações na imagem proporcionadas pela resolução da imagem e pelo foco da
25
câmera, por exemplo, visto que quanto mais desfocada encontra-se a placa, maior será o
degradê do caracter na mesma, proporcionando uma suavização dos picos dos caracteres.
Com a aplicação destas transformações morfológicas, o limiar de amplitude α pode
ser aguçado afim de diminuir as ocorrências de falso-positivos, que são ocorrências de
detecções incorretas de placas. A introdução de um outro limiar adaptativo αi em função
da diferença entre o maior e o menor valor encontrado em um perfil de linha para filtrar os
pares pi ∈ P permite maior flexibilidade a variações de luminosidade e, conseqüentemente,
um melhor resultado na identificação de assinaturas. Assim, pi será filtrado se ai <
max{α, αi }, tal que:
αi = k × [max(H) − min(H)], {k ∈ R|0 ≤ k < 1}
onde k é uma constante definida empiricamente e max(H) e min(H) são, respectivamente,

o maior e o menor valor no perfil de linha H.
4.2 Segmentação de placa utilizando árvore de componentes co-
nexos2
Como a placa de um veı́culo e seus caracteres possuem cores uniformes, é possı́vel

utilizar a árvore de componentes conexos [9] para segmentá-los. No entanto, inicialmente
precisa-se identificar os componentes conexos relativos aos caracteres, realizando um pro-
cesso de localização da placa. Para tanto, um estudo sobre a árvore de componentes
conexos relativa à região da placa e o algoritmo de localização são abordados a seguir.
4.2.1 Representação da placa na árvore de componentes
Considere uma imagem I em 256 tons de cinza com inversão de cores, ou seja,
branco tem o valor zero e preto o valor 255. Nesta imagem, as placas brasileiras de
veı́culos de uso comum possuem fundo claro e caracteres escuros. Na representação da
árvore de componentes conexos, tais caracteres encontram-se inseridos em folhas, todas
tendo a placa inserida em um nodo interno ancestral comum (Figura 13).
2
Parte desta seção foi aceita para publicação em forma de resumo nos anais do SIBGRAPI’2004 [15].
26
(a) (b)
Figura 13: Árvore de componentes conexos simplificada (b) de uma placa de um veı́culo
(a). Os elementos não relevantes para a identificação do veı́culo foram representados em
uma única folha legendada por reticências (...).
A identificação de k folhas de dimensões semelhantes e alinhadas horizontalmente

entre si, em que k denota o número de caracteres relevantes presentes em uma placa, sendo
todas elas filhas de um nodo em comum, remete a uma provável localização da placa na
imagem (Seção 4.2.2). Não necessariamente todas as folhas devem estar alinhadas entre
si, já que existem placas em duas linhas. Neste caso, porém, a placa pode ser identificada
pelo encontro de dois grupos alinhados horizontalmente.
Como pode ser observado na Fig. 13, outros componentes da placa também pos-
suem o mesmo nodo ancestral em comum, como parafusos, selos, buracos e caracteres da
cidade e estado, que não são relevantes para a identificação do veı́culo e, portanto, devem
ser ignorados.
Figura 14: Árvore de componentes conexos fictı́cia, porém semelhante à encontrada na

região das placas com pequenas variações de tonalidades.
Apesar da Fig. 13 mostrar o ancestral comum como ancestral imediato das folhas,
esta situação nunca ocorre devido à grande diferença entre os tons de ambos. Assim, exis-
27
Figura 15: Localização da placa na árvore de componentes conexos.
tem diversos nı́veis intermediários entre a folha e o ancestral comum. Ademais, a altura
entre eles raramente é a mesma para todos os caracteres, devido a pequenas variações na
tonalidade de cinza dos respectivos elementos, propiciadas por variação de iluminação ou
ruı́do na imagem (Figura 14).
4.2.2 Localização da placa
Para localizar a placa na árvore de componentes, realiza-se uma busca em largura,

agrupando a cada nı́vel percorrido, conforme semelhança de suas dimensões, os componen-
tes conexos cuja área seja superior a 15 pixels, valor definido empiricamente. Para cada
nı́vel, existe um conjunto diferente de grupos. Como todos os caracteres possuem quase
a mesma dimensão, principalmente a altura que em condições normais é a mesma, eles
são agrupados em um único grupo. Para tanto, pressupõe-se a possibilidade de segmentar
todos os caracteres em um mesmo nı́vel da árvore de componentes conexos.
Como as placas possuem uma quantidade fixa k de caracteres relevantes, somente os
grupos com pelo menos k elementos são considerados, denominados por k + − grupo (Fig.
15). Para selecionar os possı́veis candidatos a caracteres de cada k + − grupo, extraem-se
todos os subgrupos k − grupo de exatamente k elementos e verifica-se o alinhamento
horizontal deles. Aqueles subgrupos, cujos elementos estão desalinhados, são descartados.
Para verificar o alinhamento, utiliza-se uma regressão linear do centro de cada componente
28
conexo, traçando uma reta r. O subgrupo é considerado alinhado se todos os pontos

centrais dos elementos estiverem a uma distância menor que um limiar, em relação ao
ponto de mesma abscissa da reta r. Tal abordagem permite que a placa esteja inclinada
e os caracteres ainda assim sejam considerados alinhados horizontalmente (Fig. 16).
Figura 16: Reta r traçada pela regressão linear para verificar o alinhamento dos caracteres
em uma placa um pouco inclinada.
Para garantir que o subgrupo de k componentes conexos alinhados e de dimensões

semelhantes realmente pertençam a uma placa de um veı́culo, após a localização do sub-
grupo é realizado um back-tracking, a fim de encontrar o ancestral comum dos elementos.
Tal ancestral, caso seja uma placa de um veı́culo, só pode conter os k componentes conexos
como filhos entre os demais componentes do k + − grupo original, visto que não existem
na placa outros elementos de dimensões semelhantes aos k caracteres e ainda alinhados.
O subgrupo deve também satisfazer o preenchimento de pelo menos 70% da largura da
área do ancestral e 50% da altura, definidos empiricamente, conforme esperado em um
placa nacional de veı́culo.
Em alguns casos em que a placa não possua borda mais clara que a tonalidade da
mesma e o carro apresente uma cor escura, o nodo ancestral comum abrangerá não somente
a placa, mas também o carro. Neste caso, as condições anteriores não se satisfarão e uma
outra análise na árvore de componentes para a imagem negativa é realizada. Esta árvore
é percorrida procurando por um nodo que contenha a menor área, porém abrangendo
todos os componentes conexos do k − grupo. Este nodo é considerado como placa se
satisfazerem as mesmas condições do k − grupo em relação a este nodo.
29
5 Resultados
5.1 Resultados obtidos para o aprimoramento da localização de
placa verificando sua assinatura
Foram coletadas 47 imagens, feitas manualmente por uma câmera digital, de

veı́culos estacionados, durante o dia e a noite em diferentes perspectivas e distâncias
relativas à câmera. Todas as imagens foram reduzidas para o tamanho 480x320 pixels e
continham placas em duas ou uma linha, estando ortogonais à imagem, além de ilumina-
das e focadas de forma adequada.
Para os testes, foram aplicadas as versões do algoritmo de identificação de assina-
tura em perfil de linha normal e transformado morfologicamente, como proposto anteri-
ormente, em um mesmo conjunto de imagens. A região da placa foi delimitada utilizando
um polı́gono traçado manualmente, para assegurar a delimitação correta da placa, sobre
a borda da placa, permitindo, então, uma validação automática da assinatura encontrada
pelo algoritmo. Os pontos das assinaturas não pertencentes à região delimitada foram
computados como falsos-positivos (coluna FP das Tabelas 1 e 2). Ademais, foi também
contabilizado o percentual de placas encontradas (PE).
Os limiares utilizados foram constantes em todos os testes, exceto do limiar de am-
plitude, ai , que inicialmente foi testado utilizando valor nulo (resultados em FP1 e PE1
nas Tabelas 1 e 2), e em seguida o valor 0,5 (FP2 e PE2). Para o perfil de linha trans-
formado morfologicamente, foram testados quatro tamanhos diferentes para o elemento
estruturante Et , em que t denota o tamanho do mesmo.
Perfil de linha FP1 FP2 PE1 PE2

Padrão 82,7% 53,3% 94,1% 54,9%
Morfologia (E11 ) 83,8% 64,2% 94,1% 92,2%
Morfologia (E9 ) 83,5% 63,9% 94,1% 90,2%
Morfologia (E7 ) 82,2% 62,9% 94,1% 92,2%
Morfologia (E5 ) 80,7% 63,4% 94,1% 90,2%
Tabela 1: Ocorrências de falsos-positivos (FP) e placas encontradas (PE) nos testes rea-
lizados. No primeiro teste (FP1, PE1), αi era nula e no segundo αi = 0,5.
Conforme resultados demonstrados na Tabela 1, no perfil de linha transformado

30
morfologicamente, como proposto anteriormente, a placa torna-se realçada, facilitando a

identificação de assinatura. O aumento do limiar de amplitude no perfil de linha padrão
piora os resultados, enquanto no perfil de linha transformado o número de ocorrências
de falso-positivos é diminuı́do em quase vinte pontos percentuais e o número de placas
encontradas se mantém quase o mesmo.
Outras 17 imagens foram adquiridas utilizando a mesma câmera, porém em condições
irregulares variáveis, como foto à noite sem adoção de flash, placa desfocada, presença
de objetos sobrepondo parcialmente a placa e angulação aguda da câmera em relação à
placa. A Tabela 2 ilustra os resultados obtidos.
Perfil de linha FP1 FP2 PE1 PE2

Padrão 84,4% 18,3% 83,3% 38,9%
Morfologia (E11 ) 85,0% 62,3% 77,8% 66,7%
Morfologia (E9 ) 84,6% 63,1% 77,8% 66,7%
Morfologia (E7 ) 82,5% 60,1% 77,8% 66,7%
Morfologia (E5 ) 81,1% 61,7% 77,8% 66,7%
Tabela 2: Resultados obtidos na identificação da “assinatura” em teste realizado em um

conjunto de fotos em condições irregulares. No primeiro teste (FP1, PE1), αi era nula e
no segundo αi = 0,5.
Neste grupo de imagens, a grande inclinação da placa em relação a câmera pre-

judica a detecção de assinatura (Fig. 17a). O mesmo ocorre quando as condições de
iluminação da placa são precárias, pois ela não apresenta contraste aguçado na imagem
(Fig. 17b).
Os critérios de análise utilizados permitem a flexibilidade de detecção sobre um
perfil de linha com tons muito próximos, caso o limiar de amplitude seja baixo. Entre-
tanto, 98% dos pontos encontrados nos testes realizados com α = 1 são pertencentes a
falso-positivos. Neste perfil, não é possı́vel realçar os picos utilizando as transformações
morfológicas propostas devido ao perfil “arredondado”, com grande distância entre pontos
máximos e mı́nimos, a menos que o tamanho do elemento estruturante fosse excessiva-
mente grande, surtindo efeito somente sobre este tipo de imagem.
Uma limitação imposta por um limiar α de amplitude grande possibilita que placas
não sejam detectadas em linhas que contenham um contraste maior que aquele propiciado
pelos caracteres e o fundo da placa. Em contrapartida, um valor pequeno para o mesmo
31
(a) (b)
Figura 17: Análise de assinatura em imagem em condições irregulares. Em (a), a linha não
corta todos os caracteres da placa. Em (b), a iluminação é precária e a imagem encontra-se
clareada artificialmente com o perfil de linha normalizado para melhor visualização.
limiar propicia muitos falso-positivos. Nos testes realizados no primeiro grupo de imagens,
a utilização de um limiar menor resultou em um acréscimo de 181% de pontos falso-
positivos nas imagens.
A utilização de clusters foi testada para verificar o impacto da não filtragem de
pares, identificando assinaturas em grupos de pares cuja amplitude é semelhante. Nos
testes realizados, o resultado foi praticamente o mesmo, variando aleatoriamente em menos
de 0,1% na quantidade de falso-positivos.
5.2 Resultados obtidos para a segmentação de placa utilizando
árvore de componentes conexos
O algoritmo de construção da árvore de componentes conexos e de localização da

placa foi implementado em C# e testado em um computador equipado com um Pentium-
4, 1.8 GHz. As trinta imagens avaliadas foram obtidas utilizando uma câmera digital
somente durante o dia e redimensionadas para o tamanho 480x360. Ao contrário dos testes
realizados na Seção 5.1, somente imagens com placas de uma linha foram utilizadas, apesar
da implementação de segmentação de placas de duas linhas utilizando o método proposto
ser trivial. Esta implementação não foi realizada devido a priorização em melhorar o
algoritmo descrito. O tempo médio de execução foi de 17 segundos e 50% das placas
foram identificadas. A Fig. 19 ilustra algumas destas segmentações. Apesar do baixo
ı́ndice de identificação, apenas quatro imagens apresentaram algum falso-positivo.
32
Um problema ocorrido em grande parte das placas não identificadas é ilustrado na

Fig. 18. A iluminação não-uniforme pode proporcionar a segmentação dos caracteres em
diferentes nı́veis da árvore. Neste exemplo (Fig. 18b), os numerais “5” e “8” só encontram-
se segmentados no nı́vel 107, porém a letra “G”, que encontra-se segmentada na árvore
desde o nı́vel 45, possui um tom mais claro, não alcançando o nı́vel de segmentação dos
numerais “5” e “8”. Assim, não é possı́vel agrupar todos os caracteres segmentados em
um mesmo nı́vel da árvore durante a busca em largura, causando falha na identificação
da placa.
(a) (b)
Figura 18: Iluminação não-uniforme prejudica a identificação da placa.
6 Conclusão
A segmentação automática de placas de veı́culos utilizando processamento digital

é ainda um problema não solucionado de forma satisfatória. As técnicas estudadas e
desenvolvidas apresentam falhas diante de um contexto especı́fico, como placas inclinadas
ou em condições de iluminação não uniformes.
É importante que a técnica de localização de placas seja precisa, visto que o pro-
cessamento de segmentação em uma região da imagem em que não há presença de placa
implica em consumo desnecessário de tempo, sendo este um fator crucial para a iden-
tificação de veı́culos em tempo-real. Na técnica de localização de placa utilizando veri-
33
Figura 19: Placas segmentadas corretamente utilizando árvore de componentes conexos.

34
ficação de sua assinatura, por exemplo, em sua proposta original, é freqüente a ocorrência
de falsos-positivos.
Neste trabalho, esta técnica foi aprimorada com a util com a utilização de ope-
radores morfológicos sobre o perfil de linha, utilizado para verificação da assinatura da
placa. Com isso, a eficácia desta técnica foi melhorada, embora a quantidade de limiares
inviabiliza a utilização prática da mesma. Ademais, a técnica não é robusta quanto a
variações de perspectiva da placa.
Também foi desenvolvida, neste trabalho, uma técnica de localização e segmentação
de placa utilizando árvore de componentes conexos. Nesta técnica é explorada a confi-
guração dos componentes conexos alinhados em um mesmo nı́vel da árvore que possuem
ancestral comum, identificando os caracteres nos nós em nı́veis superiores e o fundo da
placa no ancestral comum. Apesar desta apresentar um baixo ı́ndice de localização de pla-
cas, ela é robusta em relação a problemas tradicionais encontrados na literatura acerca da
localização de placas, como variações de perspectiva e escala, apresentando quase nenhum
falso-positivo.
Grande parte das placas não identificadas por esta técnica se deve à iluminação
não-uniforme sobre a placa. A utilização de busca em largura para encontrar os caracte-
res segmentados em um mesmo nı́vel da árvore inviabiliza a localização de placas nesta
condição, sendo este um objeto de estudo para trabalhos futuros.
Referências
[1] J. Barroso, A. Rafael, E. L. Dagless, and J. Bulas-Cruz. Number plate reading

using computer vision. In IEEE - International Symposium on Industrial Electronics
ISIE’97, Universidade do Minho, Guimarães, 1997.
[2] Fernando Peixoto Coelho de Souza. Localização e leitura automática de caracteres

alfanuméricos - uma aplicação na identificação de veı́culos. Master’s thesis, Escola
de Engenharia, Universidade Federal do Rio Grande do Sul, 2000.
[3] Halina Kwaśnicka and Bartosz Wawrzyniak. License plate localization and recogni-
35
tion in camera pictures. In AI-METH 2002 - Artificial Intelligence Methods, Gliwice,

Poland, 2002.
[4] Giovanni Adorni, Federico Bergenti, and Stefano Cagnoni. Vehicle license plate recog-
nition by means of cellular automata. In Proc. of the IEEE International Conference
on Intelligent Vehicles, pages 689–693, 1998.
[5] Fernando Martı́n and David Borges. Automatic car plate recognition using a partial
segmentation algorithm. In M.H. Hamza, editor, Signal Processing, Pattern Recog-
nition, and Applications, 2003.
[6] J.W. Hsieh, S.H. Yu, and Y.S. Chen. Morphology-based license plate detection from
complex scenes. In ICPR02, volume III, pages 176–179, 2002.
[7] Shyang-Lih Chang, Li-Shien Chen, Yun-Chung Chung, and Sei-Wan Chen. Auto-
matic license plate recognition. IEEE Transactions on Intelligent Transportation
Systems, 5(1):42–53, March 2004.
[8] Maged M. M. Fahmy. Automatic number-plate recognition: Neural network appro-

ach. In IEEE Vehicle Navigation and Information Systems, pages 99–101, 1994.
[9] R. Jones. Component trees for image filtering and segmentation. In E. Coyle, editor,
Proceedings of the 1997 IEEE Workshop on Nonlinear Signal and Image Processing,
Mackinac Island, September 1997.
[10] Jean Serra. Image Analysis and Mathematical Morphology: Theoretical Advances,
volume 2. Academic Press, 1988.
[11] Jacques Facon. Morfologia Matemática: Teoria e Exemplos. Editora Universitária

Champagnat da Pontı́ficia Universidade Católica do Paraná (in portuguese), 1996.
[12] P. Soille. Morphological Image Analysis. Springer-Verlag, 1999.
[13] Júlio César e Melo and Silvio Jamil F. Guimarães. Localização de placas de veı́culos
baseada em regiões de contraste realçadas por operadores morfológicos. In SIB-
GRAPI’2004 Proceedings, Curitiba, October 2004.
36
[14] Júlio César e Melo and Silvio Jamil F. Guimarães. Definição de assinatura de pla-
cas de veı́culos com base em regiões de contraste. In Anais do V Workshop em
Tratamento de Imagens, pages 138–146, Belo Horizonte, May 2004.
[15] Júlio César e Melo and Silvio Jamil F. Guimarães. License plate segmentation using
component tree. In SIBGRAPI’2004 Proceedings, Curitiba, October 2004.

Localização e Segmentação de Placas para Identificação Automática de Veículos

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Localização e Segmentação de Placas para Identificação Automática de Veículos

Uploaded by

Copyright:

Available Formats

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE MINAS GERAIS

Júlio César e Melo

Trabalho de diplomação apresentado ao Curso de

Orientador: Prof. Silvio Jamil Ferzoli Guimarães.

Júlio César e Melo

Prof. Silvio Jamil Ferzoli Guimarães (Orientador)

Profa. Rosilane Ribeiro da Mota

Profa. Fátima de Lima Procópio Duarte Figueiredo

“Alea jacta est!”

A identificação automática de veı́culos depende da localização da(s) placa(s)

do(s) respectivo(s) veı́culo(s) na imagem digital, da segmentação de seus caracteres

e do sistema de reconhecimento de caracteres. Variações na imagem proporcionadas

por diversidade climática, ambiental e danificações mecânicas na placa, ademais da

sobreposição da placa por outros objetos na imagem, dificultam o processo de iden-

tificação. Neste trabalho, propõe-se uma adaptação de uma técnica de localização

de placa, reduzindo as ocorrências de falsos-positivos, e a adoção de uma técnica de

segmentação, utilizando árvore de componentes conexos para localizar e segmentar

os caracteres da placa. Esta última mostra-se robusta em relação aos problemas

tradicionais da literatura, como rotação da placa, porém apresenta dificuldade para

identificar placas com iluminação não-uniforme.

1 Processo de reconhecimento de placa a partir de uma imagem . . . . . . . 10

1 Ocorrências de falsos-positivos e placas encontradas nos testes realizados . 29

A identificação de veı́culos é uma tarefa observada em todos ambientes em que

• O sistema está sujeito a obter imagens com variações de luminosidade ou climática,

• Danificações mecânicas podem impedir a visualização completa da placa;

• No Brasil, existem placas em uma ou duas linhas e em diferentes combinações de

• As placas podem estar inclinadas ou parcialmente ocultas.

O sistema de reconhecimento de placas, que identifica um veı́culo, pode ser divi-

Figura 1: Processo de reconhecimento de placa a partir de uma imagem.

2.1 Bibliografia básica de processamento de imagens

Para a compreensão das técnicas de localização e segmentação de placas, é ne-

2.1.1 Morfologia matemática

Algoritmos de localização de placa baseados em cores remete a um problema tı́pico

como serão descritas a seguir:

onde I denota a imagem a ser processada, ⊕ a dilatação e a erosão, dado o elemento

2.1.2 Árvore de componentes conexos

Figura 2: Um componente conexo de cor preta.

x − 1 da árvore, enquanto na imagem original nı́veis de cinza diferentes apenas separam

(a) (b) (c)

Figura 3: Representação de uma imagem em tons cinzas (a) em forma tridimensional

(a) (b) (c)

Figura 4: Exemplo de filtragem da árvore de componentes conexos da Fig. 3. Os compo-

2.2 Técnicas de localização e segmentação de placas

2.2.1 Localização da placa baseada em sua assinatura

Inicialmente proposta por Barroso et al [1], a técnica de localização pela “assina-

2.2.2 Segmentação de placa utilizando black top-hat

Martı́n e Borges [5] utilizaram as transformações morfológicas (Seção 2.1.1) black

Considerando que os caracteres da placa são elementos negros e finos dentro de um

segmentação da placa possui uma forma circular.

(a) (b) (c)

2.2.3 Segmentação de placa utilizando diferença de abertura e fechamento

Uma técnica tolerante à inversão de cores da placa é proposta por Hsieh, Yu e

(a) (b) (c)

Figura 7: Resultado da operação de diferenciação da abertura e do fechamento. A imagem

2.2.4 Segmentação de placa utilizando componentes conexos

A localização de placa utilizando análise de componentes conexos foi proposta por

Este trabalho objetiva:

1. Aprimorar e combinar técnicas de localização e segmentação de placas, visando:

• Desempenho suficiente para a identificação on-line do(s) veı́culo(s) presente(s)

• Maximização da identificação de presença de placas;

• Flexibilidade para identificação de placas em diferentes formatos (uma ou duas

• Flexibilidade para variações nas condições ambientais e/ou climáticas;

• Tolerância a ruı́dos na imagem, inclusive àqueles propiciados por danificações

2. Desenvolvimento de nova técnica de localização e segmentação da placa, utilizando