Professional Documents
Culture Documents
Escopo de investigação
•Esqueletização
>Algoritmo de G&W
Extração
>Morfologia matemática
de •Detecção de Bordas
Características •Momentum
•Regiões de Pressão
•Descrição estrutural
Assinatura Pré-processada
cinza/binária
Imagens
2
Reconhecimento off-line de Assinaturas
• Base de Dados
– 50 classes (autores)
– 20 assinaturas verdadeiras por classe
– 20 assinaturas falsas por classe
• 10 simples ou randômicas
• 10 habilidosas
– Total de 2000 amostras
4
Reconhecimento off-line de Assinaturas
Segmentação
Do formulário e das assinaturas individuais
A partir das projeções vertical e horizontal
Pré-processamento
Equalização de Amortecimento
Background
Binarização Extração
da imagem
5
Extração de características
6
Momentum
7
Bordas e Inclinação
8
Regiões de Pressão
9
Reconhecimento off-line de Assinaturas
Armazenamento
Imagens
Original, segmentada e pré-processada, esqueleto, borda e
pressão
Formato GIF
Experimentos
Apenas verificação
Classificadores K vmp, MLP MP e Neuro-Fuzzy
Treinamento: 1 a 5 verdadeiras
Teste: 15 verdadeiras + 20 falsas
Criterio de rejeição: Neuro-Fuzzy e K vmp
rejeitar X (C - R) < X < (C + R)
C-R C C+R
11
Reconhecimento off-line de Assinaturas
12
Reconhecimento off-line de Assinaturas
• MLP Backpropagation
– Investigadas 3 arquiteturas
• (a) entradas[12], escondida[12], saída[1]
• (b) entradas[12], escondida[6], saída[1] -- melhor
• (c) entradas[12], escondida[3], saída[1]
13
Reconhecimento off-line de Assinaturas
14
Reconhecimento off-line de Assinaturas
Atividades desenvolvidas
15
Sistemas de Visão Biologicamente Inspirados
16
Sistemas de Visão Biologicamente Inspirados
• System’s architecture
Model base
Model
relationships
Feature Extract primal Foveate
planes sketch planes Image
Cluster
objects
17
Sistemas de Visão Biologicamente Inspirados
• Image representation
– Gaussian receptive field
function
– Local contrast normalisation
for estimating original
reflectance information
– Primal sketch features (edges,
bars, blobs and ends) learned
and extracted using a neural
network approach
– Log-polar
18
Sistemas de Visão Biologicamente Inspirados
19
Extração de Características
• Related Work
– Neural network learning of Edge features [CTR95,PB92]
• Limited to edges
• Comparable to Sobel or Canny performances
– Arbitrary features in the log-polar domain [GF96]
• Operators manually designed
• Poor sensitivity to the feature´s contrast
• Limited to a fixed window size
Edge@0 = ABS(f+a+b-c-d-e)/3
a
f b Edge@60 = ABS(a+b+c-d-e-f)/3
x
e c ...
d +Blob = MIN(x-a,x-b,x-c,x-d,x-e,x-f)
20
Extração de Características
• Training process
recep. field
windows
Normalise Compute Build Train Neural
Orientation Projection Training Set Networks
21
Extração de Características
• Testing process
position
orientation
Apply Compute
Extract Normalise Compute
Neural Feature
Recep. Fields Orientation Projection
Networks Planes
Feature class, position
contrast and orientation
Edge Edge Edge
Planes
Test Bar Bar Bar
PCs NN
Images Blob Blob Blob
End End End
22
Extração de Características
23
Extração de Características
Edge
.
Bar
N
.
. Ñ
Blob
End
24
Extração de Características
• Evaluation
– Ground truth for untrained synthetic features
25
Extração de Características
26
Extração de Características
27
Extração de Características
28
Extração de Características
• Conclusions
– New learning-based approach to extracting primal
sketch features
– Better results when compared to a previous approach
• More correctly classified features
• Good estimate for the feature´s contrast
• Can be easily applied to different window sizes and new
feature types
– Successfully being used as the core representation in
the problem of learning structural relationships from
sets of 2D image-based models
29
Reconhecimento de Objetos Baseado na
Aparência Usando SVM
31
Reconhecimento de Objetos Baseado na
Aparência Usando SVM
32
Reconhecimento de Objetos Baseado na
Aparência Usando SVM
• Resultados:
–Taxa média de
reconheci-
mento foi 90%;
–Melhor taxa
98%, para
T=13;
–Pior taxa 71%
para T=1;
34
Reconhecimento de Objetos Baseado na
Aparência Usando SVM
• Pré-processamento: todas as imagens foram
convertidas para níveis de cinza e re-escalonadas
para o tamanho 32x32 pixels.
– Dependendo do ângulo algumas imagens parecem
maiores.
• Ferramentas:
– Para SVM: LIBSVM, disponível em
www.csie.ntu.edu.tw/~cjlin/libsvm.
36
Reconhecimento de Objetos Baseado na
Aparência Usando SVM
37
Reconhecimento de Objetos Baseado na
Aparência Usando SVM
38
Reconhecimento de Objetos Baseado na
Aparência Usando SVM
• Resultados:
40
Reconhecimento de Objetos Baseado na
Aparência Usando SVM
• Resultados
42
Reconhecimento de Objetos Baseado na
Aparência Usando SVM
43
Reconhecimento de Objetos Baseado na
Aparência Usando SVM
As técnicas apresentaram
desempenho semelhante
Figura 13
Curvas de
reconhecimento
para SVM e
Redes Neurais
44
Reconhecimento de Objetos Baseado na
Aparência Usando SVM
• Conclusões
• Descrição do problema
– Dirigir processamento intensivo da
informação visual;
• Sistemas de Apoio ao Motorista (Driver
Support Systems – DSS);
– Segurança;
– Conforto.
• Segurança de tráfego Sinalização:
– Desatenção;
– Tráfego intenso;
– O sistema como um co-piloto
47
Reconhecimento de Placas de
Sinalização
• Objetivos e Relevância:
– Escopo do trabalho;
– Objetivos principais:
• Estudar e implementar um mecanismo de atenção
visual;
• Investigar a utilização de uma Rede Neural para a
tarefa de classificação.
– Contribuições:
• Perspectiva de geração de conhecimentos para o
desenvolvimento de tecnologia nacional em DSS;
• Proposta de um modelo híbrido biologicamente
inspirado;
– Mecanismo de Atenção Visual + Redes
Neurais. 48
Reconhecimento de Placas de
Sinalização
• Objetivos e Relevância:
– Contribuições:
• Demonstração da aplicabilidade de um
mecanismo de atenção visual à tarefa de
localização de placas;
• Perspectiva de parcerias.
49
Reconhecimento
ReconhecimentodedePlacas
Placasde
de
Sinalização
Sinalização
• Trabalhos relacionados:
– Detecção de obstáculos;
– Detecção de marcas da pista;
– Sistemas Integrados;
– Detecção e reconhecimento de sinais de tráfego:
• Busca reduzida através de algum conhecimento a
Piccioli e priori;
Colegas, • Análise geométrica das arestas da imagem;
1996
• Reconhecimento Correlação cruzada
50
Reconhecimento de Placas de
Sinalização
• Trabalhos relacionados:
– Detecção e reconhecimento de sinais de tráfego:
• Segmentação de cor (Color Structure Code);
Priese e • Reconhecimento controle fuzzy;
colegas,
1993 • Parceria: Daimler-Benz e Universidade Koblenz-
Landau
51
Reconhecimento de Placas de
Sinalização
• Arquitetura Geral
52
Reconhecimento de Placas de
Sinalização
• Experimentos preliminares:
– Seleção manual de Placas;
– Classe: placas pare, proibido ultrapassar e
imagens sem placas – 14 imagens;
– Pré-processamento;
– Treinando com T padrões e testando com 14-T;
– Resultados:
• Melhor taxa – 100% ;
• Pior taxa – 56,41%;
• Indicaram a possibilidade de classificar imagens
pequenas (20x20 pixels).
53
Reconhecimento de Placas de
Sinalização
• Definição da Arquitetura Neural:
– Camada de entrada = 400 neurônios tamanho das
imagens;
– Camada de saída = número de classes winner-takes-all;
– Camada escondida No de Neurônios SSE/1000 Épocas
7 29,8216
14 3,2632
21 1,0610
Classes Saídas Desejadas
28 0,1326
1 1000000 35 0,1261
2 0100000 42 1,0976
3 0010000 49 1,0945
4 0001000 56 0,9165
5 0000100 63 0,7991
6 0000010 70 1,0807 54
7 0000001
Reconhecimento de Placas de
Sinalização
• Módulo de Detecção:
– Imagens com placas 15 imagens 16 placas;
– Número fixo de regiões selecionadas (K);
– Resultados:
• K=5 75% de localização (12 imagens);
• K=19 93,75% de localização (15 imagens);
– Análise a partir da complexidade da busca:
• K=5 0,0059% dos pontos da imagem;
• K=19 0,0225% dos pontos imagem;
– Comparação com a geração randômica de pontos de
interesse;
55
Reconhecimento de Placas de
Sinalização
• Integração dos módulos:
– Formação de novos conjuntos de treinamento e
teste;
• Ocorrência de placas durante o vídeo;
• Poucas ocorrências escolhidas 2 por classe;
• Quadros sucessivos + microsacadas = 85 imagens por
classe;
• 7 classes:
57
Reconhecimento de Placas de
Sinalização
• Integração dos módulos:
– Resultados – Módulo de Reconhecimento:
• Arquitetura definida através de experimentos anteriores;
• Taxa de acerto no treinamento 100%;
• Baixas taxas de acerto nos testes:
Classe Taxa de Acerto
1 12,94 %
2 28,23 %
3 2,35 %
4 1,18 %
5 12,94 %
6 57,64 %
7 8,23 %
58
Reconhecimento de Placas de
Sinalização
59
Reconhecimento de Placas de
Sinalização
• Integração dos módulos:
– Resultados: Classe – Classe Taxa de Acerto
1–2 90 %
1–3 40 %
1–4 60 %
Módulo de 1–5 60 %
Reconhecimento 1–6 60 %
2–3 50 %
2–4 80 %
ANÁLISE POR 2–5 60 %
• Conclusões
– O Trabalho apresentou:
• Estudo e implementação de uma mecanismo de
atenção;
• Investigação preliminar no uso de Redes Neurais.
– Caráter multidisciplinar:
• Inteligência Artificial, visão Computacional, Atenção
Visual, Neurofisiologia etc.
– Objetivos alcançados;
• Módulo de Detecção eficiente:
– Demonstrando a utilidade na aplicação do mecanismo
de atenção no problema investigado.
63
Reconhecimento de Placas de
Sinalização
– Objetivos alcançados;
• Investigação da abordagem neural:
– Resultados + características das imagens possível
alcançar taxa melhores de classificação.
– Contribuições:
• Estratégia de microsacadas;
• Aplicação do mecanismo de atenção na área de
DSS;
• Experimentos com imagens reais de ruas e
estradas.
64
Reconhecimento de Placas de
Sinalização
• Dificuldades:
– Nível experimental da área de atenção visual;
– Limitação dos recursos materiais:
• Veículos adaptados, câmeras apropriadas, hardwares
dedicados, processamento paralelo, computadores de
bordo, conservação das rodovias.
• Trabalhos futuros:
– Finalizar a integração dos classificadores
binários;
– Aquisição de novas imagens;
65
Reconhecimento de Placas de
Sinalização
• Trabalhos futuros:
– Implementação do Módulo de Detecção em
uma arquitetura dedicada (ex. FPGA);
– Aplicar pré-processamento mais completo;
– Utilizar uma representação mais compacta das
imagens;
– Investigar outras arquiteturas neurais para a
tarefa de classificação (Kröner, 1996);
66