Avaliação e Interpretação Do Raciocínio Espacial - Scribd PDF

VALQUIRIA FENELON PEREIRA
Interpretao de Imagens com Raciocnio Espacial

Qualitativo Probabilstico
So Paulo
2014

Tese apresentada Escola Politcnica da

Universidade de So Paulo para obteno do
Ttulo de Doutor em Engenharia.
So Paulo
2014

Tese apresentada Escola Politcnica da Univer-

sidade de So Paulo para obteno do Ttulo de
Doutor em Engenharia.
rea de Concentrao: Engenharia de Controle e

Automao Mecnica
Orientador: Prof. Dr. Fbio Gagliardi Cozman
So Paulo
2014
Este exemplar foi revisado e corrigido em relao verso original, sob
responsabilidade nica do autor e com a anuncia de seu orientador.
So Paulo, 23 de abril de 2014.
Assinatura do autor ____________________________
Assinatura do orientador _______________________
Catalogao-na-publicao
Pereira, Valquiria Fenelon

Interpretao de imagens com raciocnio espacial
qualitativo
probabilstico / V.F. Pereira. -- verso corr. -- So Paulo, 2014.
174 p.
Tese (Doutorado) - Escola Politcnica da Universidade de

So Paulo. Departamento de Engenharia Mecatrnica e de
Sistemas Mecnicos.
FICHA CATALOGRFICA
1.Robtica 2.Interpretao de imagens 3.Raciocnio espacial
qualitativo probabilstico I.Universidade de So Paulo. Escola
Politcnica. Departamento de Engenharia Mecatrnica e de Sis-
temas Mecnicos II.t.
A todos que me incentivaram a seguir
os meus sonhos. E ao universo que me
ps nessa direo. E aos leitores que
foram escolhidos ou escolheram ler
essas pginas.
AGRADECIMENTOS
Antes de comear a lista de agradecimentos, quero dizer que experimentei sensaes

extremas, acreditei e duvidei, sorri e chorei, me perdi e me encontrei, mas no estive s, sempre
tive algum que me desse apoio, ou diretamente com esse doutorado, ou indiretamente me
ajudando a manter minha sade mental. Espero que me perdoem aqueles que por falha da minha
memria no forem citados aqui, por favor, saibam que em meu corao sou grata a todos que
estiveram comigo durante essa jornada.
Ao meu orientador Prof Dr Fbio Cozman com sua pacincia em tentar me ouvir e em
me orientar em momentos cruciais e me indicar quais os caminhos provveis a seguir onde a
expectativa era maximar o sucesso e as descobertas. Ao Prof Dr Paulo Eduardo Santos que
foi meu orientador na iniciao cientfica e no mestrado. Agradeo muito todos os conselhos,
bate-papos, seu tempo e dedicao para me orientar nestes dez anos.
Aos meus amigos e colegas que me apoiaram, mas em especial ao meu amigo Murilo
que me deu a oportunidade de passar alguns dias em sua casa e conseguiu uma mesa no Imperial
College para eu trabalhar e preparar minha primeira apresentao de workshop, alm de me
ajudar na realizao do ltimo experimento e toda a ajuda entre esses eventos. E ao Angelo
que me ajudou vrias vezes com dicas e conversas que desataram alguns ns de programao.
Aos colegas do laboratrio de tomada de deciso ao Ochoa e ao Polastro que me ajudaram na
primeira etapa esse trabalho. Ao pessoal do projeto Fapesp em especial a Anna e Renata que
dispensaram algum tempo e ideias para solues de alguns problemas encontrados no caminho.
minha famlia, me e pai pelo apoio e incentivo para chegar at aqui e continuar
seguindo em frente. Ao meu filho dipo que algumas vezes segurou as pontas para que eu
seguisse trabalhando sem culpa. Agradeo tambm ao Danisio que me ajudou a redescobrir a
fora para continuar, j que na hora que eu mais precisei ele reapareceu e mostrou a importncia
de realizar os sonhos. E tia J que fez perguntas sobre meu trabalho que nem sempre foram
simples de responder.
CAPES, pelo apoio financeiro. Fapesp pelo financiamento do projeto temtico ao
qual meu trabalho esteve inserido. A instituio FEI e seus funcionrios pelo apoio com material
e infraestrutura necessrios para realizao dos testes, e a utilizao do laboratrio e do rob
P eopleBotT M . EPUSP por disponibilizar auxilio de custo para participar de conferncias.
I want to give to Britta and Hannah my special thanks for all data and ideas that you have
provided directly or indirectly for me in this work. And for all colleagues on Imperial College
who received me in your laboratory, in special Pedro and Julia for help me on my first day on
Edinburgh and for all folks who helped me with my first international presentation.
O senhor mire e veja. O mais importante e bonito, do mundo, isto: que as pessoas no esto
sempre iguais, ainda no foram terminadas mas que elas vo sempre mudando. Afinam e
desafinam. Verdade maior. O senhor saiba: eu toda a minha vida pensei por mim, forro, sou
nascido diferente. Eu sou eu mesmo. Divirjo de todo o mundo... Natureza da gente no cabe
em nenhuma certeza. Quem sabe direito o que uma pessoa ? Antes sendo: julgamento sempre
defeituoso, porque o que a gente julga o passado. Que isso foi o que sempre me invocou, o
senhor sabe: eu careo de que o bom seja bom e o ruim, que dum lado esteja o preto e do outro
o branco, que o feio fique bem apartado do bonito e a alegria longe da tristeza! Quero os todos
pastos demarcados... Como que posso com este mundo? A vida ingrata no macio de si; mas
transtraz a esperana mesmo do meio do fel do desespero. Ao que, este mundo muito
misturado...Se no, o senhor me diga: preto preto? branco branco? Ou: quando que a
velhice comea, surgindo de dentro da mocidade?
Grande Sertes Vereda, Guimares Rosa
RESUMO
Um sistema artificial pode usar raciocnio espacial qualitativo para inferir infor-
maes sobre seu ambiente tridimensional a partir de imagens bidimensionais. Inferncias
realizadas com base em raciocnio espacial qualitativo devem ser capazes de lidar com
incertezas. Neste trabalho investigamos a utilizao de tcnicas probabilsticas para tornar
o raciocnio espacial qualitativo mais robusto a incertezas e aplicvel a agentes mveis
em ambientes reais. Investigamos uma formalizao de raciocnio espacial com lgica de
descrio probabilstica em um subdomnio de trfego. Desenvolvemos tambm um mtodo
que combina raciocnio espacial qualitativo com um filtro Bayesiano para desenvolver dois
sistemas que foram aplicados na auto localizao de um rob mvel. Executamos dois
experimentos de auto localizao; um utilizando a teoria de relaes qualitativas percebveis
sobre sombra com filtro Bayesiano; e outro utilizando o clculo de ocluso de regies e o
clculo de direo com filtro Bayesiano. Ambos os sistemas obtiveram resultados positivos
onde somente o raciocnio espacial qualitativo no foi capaz de inferir a localizao do rob.
Os experimentos com dados reais mostraram robustez aos rudos e informao parcial.
Palavras-chaves: Raciocnio Espacial Qualitativo, Filtro Bayesiano, Lgica Proba-

bilstica, Robtica Cognitiva, Auto Localizao Qualitativa.
ABSTRACT
An artificial system can use qualitative spatial reasoning to obtain information
about its tridimensional environment, from bi-dimensional images. Inferences produced by
qualitative spatial reasoning must be able to deal with uncertainty. This work investigates
the use of probabilistic techniques to make qualitative spatial reasoning more robust against
uncertainty, and better applicable to mobile agents in real environments. The work investi-
gates a formalization of spatial reasoning using probabilistic description logics in a traffic
domain. Additionally, a method is presented that combines qualitative spatial reasoning
with a Bayesian filter, to develop two systems that are applied to self-localization of mo-
bile robots. Two experiments are described; one using the theory of perceptual qualitative
relations about shadows; the other using occlusion calculus and direction calculus. Both
systems are combined with a Bayesian filter producing positive results in situations where
qualitative spatial reasoning alone cannot infer robot location. Experiments with real data
show robustness to noise and partial information.
Key-words: Qualitative Spatial Reasoning, Bayesian Filter, Probabilistic Logic, Cognitive

Robotics, Qualitative Self Localisation.
LISTA DE FIGURAS
Figura 1 Diagrama conceitual de vizinhana (CND - Conceptual Neighborhood Diagram) das relaes
RCC-8. Note a continuidade das transies topolgicas entre regies (indicadas pelas setas),
as mudanas de relaes ocorrem sempre para uma relao vizinha. . . . . . . . . . . . 39
Figura 2 Representao grfica das composies R1 (a, b) e R2 (b, c) antes e depois da transio
representada pela seta, note que o conjunto resultante R3 (a, c) so as relaes possveis
(Tabela 2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Figura 3 Duas sequncias de imagens (da esquerda para direita) onde um cone passa em frente
(sequncia superior) e por trs (sequncia inferior) do cilindro, este um exemplo da ocluso
em ao. Note na ocorrncia de ocluso os dois objetos formam uma nica regio na imagem. 42
Figura 4 Mudana na percepo da ocluso causada pelo movimento do observador (paralaxe). . . . 43
Figura 5 Modelo grfico das 20 relaes bsicas do clculo sobre ocluso de regio, o ROC-20. . . 44
Figura 6 Estudos sobre sombra de Leonardo da Vinci. No esboo v-se representados as sombras do
objeto projetadas em outra superfcie (sombra-projetada) e no prprio objeto (sombra-prpria). 46
Figura 7 Efeito na localizao do objeto ocasionado pela posio da sombra. . . . . . . . . . . . 47
Figura 8 Bola na caixa. Mesmo na mesma localizao da bola em (b) e (c) percebemos posicionamen-
tos diferentes devido sombra. . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Figura 9 Representao grfica das relaes bsicas do PQRS. . . . . . . . . . . . . . . . . . 49
Figura 10 Imagens capturadas pelo P eopleBotT M . Representando as relaes PQRS (a) NonOc-
cludesDC(o,s), (b) NonOccludesEC(o,s), (c) PartiallyOccludesPO(o,s), (d) PartiallyOcclu-
desTPP(o,s), (e) TotallyOccludesTPPI(o,s), (f) TotallyOccludesEQ(o,s) e (g) TotallyOcclu-
desNTPPI(o,s). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Figura 11 (a) Um objeto com sua sombra conectada e projetada numa superfcie irregular, destaque
para a parte da sombra relativa a parte superior do objeto; (b) Regies distintas expressas
pela observao do objeto e sua sombra, definidas pelas linhas de viso. . . . . . . . . . 52
Figura 12 Como a sombra aparece quando somente o observador altera sua posio para: (a) regio 1,
(b) regio 2, (c) regio 3, (d) regio 4 e (e) regio 5 representadas no mapa da Figura 11b . 54
Figura 13 Imagens capturadas no laboratrio, onde podemos aplicar a frmula de correspondncia de
sombra, note somente a sombra do objeto est externamente conectada sua base e mais
distante da fonte de luz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
Figura 14 Por causa das sombras podemos inferir que h outro objeto totalmente ocluso pelo balde. . 57
Figura 15 Representao da projeo em quadrante, sendo os elementos representados como ponto
(direito) e regio (esquerda). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
Figura 16 Exemplo de representao CRALC em rede Bayesiana da incluso e da definio. . . . . 67
Figura 17 Exemplo de redes e tabelas de probabilidades condicionais geradas pelos construtores lgicos 67
Figura 18 Exemplo de representao CRALC em rede Bayesiana da restrio de existencial. . . . . 68
Figura 19 Exemplo de representao CRALC em rede Bayesiana da restrio universal. . . . . . . 68
Figura 20 Exemplo grfico de uma rede gerada a partir de uma terminologia , e sua caracterstica para
um domnio com dois indivduos [a, b] . . . . . . . . . . . . . . . . . . . . . . . . 69
Figura 21 Representao grfica do cubo de cores RGB, o cone da esquerda representa como uma
cor(80,200,130) est localizada neste sistema cartesiano. . . . . . . . . . . . . . . . . 73
Figura 22 Representao grfica do cone HSV. . . . . . . . . . . . . . . . . . . . . . . . . . 73
Figura 23 Grfico representando o filtro de limiar e o limiar T . . . . . . . . . . . . . . . . . . 74
Figura 24 Representao grfica da dilatao e da eroso com uma matriz 3x3 com elemento estrutu-
rante E. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
Figura 25 Exemplo da aplicao do componente conectado, a partir da imagem original (esquerda) um
filtro limiar e morfolgico aplicado (meio) o resultado na imagem com grupos de mesmo
valor (representado pela cor). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
Figura 26 Representao grfica do cenrio de trfego (mo francesa). (a) Representao da rua, faixa,
e linhas divisrias. (b) Representao do veculo no cenrio. . . . . . . . . . . . . . . 80
Figura 27 (a) Cena Original. (b) Exemplo dos dados dos sensores para o cenrio da cena original. . . 81
Figura 28 Um sistema cardeal para vias: A est ao sul de B e oeste de C. . . . . . . . . . . . . . 82
Figura 29 Domnio de trfego e todas as situaes possveis para o veculo que esteja dentro das regras. 86
Figura 30 Rede Bayesiana formada com conceitos e papis embutidos no banco de conhecimento.
Todos os ns em azul so evidncias observadas pelos sensores. . . . . . . . . . . . . 89
Figura 31 Exemplo de trs cenrios de trfego, onde o carro est descendo uma via de mo nica. . . 91
Figura 32 Rede Bayesiana relacional representando um domnio de trafego com papis e indivduos
representando veculo, faixas, e linha divisria. . . . . . . . . . . . . . . . . . . . 92
Figura 33 Rede Bayesiana baseado na tabela de composio (Tabela 8) . . . . . . . . . . . . . . 93
Figura 34 Representao espacial (a) das regies considerando um ambiente real, e (b) representao
do mapa qualitativo com a cinco regies distintas, mostrando os lados direito e esquerdo e as
regies(Region1 at Region5 ). As linhas de viso entre a fonte de luz L, o objeto O e sua
sombra definem as fronteiras entre as regies. Neste diagrama somente o topo da sombra
utilizado na definio das regies. . . . . . . . . . . . . . . . . . . . . . . . . . . 101
Figura 35 Uma representao da posio dos objetos no contexto deste experimento. . . . . . . . . 101
Figura 36 Uma representao grfica para a definio das direes Left, Right, Front e Behind (esquerda,
direita, em frente, atrs) relativos viso do rob atravs da imagem. Os eixos de coordenadas
da imagem tem origem no canto acima-direito relativo imagem. . . . . . . . . . . . . 103
Figura 37 Diagrama representando nove regies formadas pelas linhas de viso. . . . . . . . . . . 103
Figura 38 As duas figuras representam as regies e as relaes espaciais percebidas em cada uma
(a)As relaes de ocluso e (b) as relaes de direo para cada regio, todas as relaes
percebidas por um observador . Somente a regio Region9 no possvel visualizar o par
em nenhuma posio do observador. . . . . . . . . . . . . . . . . . . . . . . . . . 104
Figura 39 Exemplo de uma visualizao para (a) Region1 , (b) Region2 , (c) Region3 , (d) Region4 ,
(e) Region5 , (f) Region6 , (g) Region7 , (h) Region8 , (i e j) Region9 onde os objetos esto
livres de ocluso, mas o campo de viso no permite visualizar os dois em uma mesma cena. 106
Figura 40 Representaes dos mapas qualitativos formados pelas linha de viso com duas configuraes
de posio que os trs objetos podem assumir neste contexto. . . . . . . . . . . . . . 107
Figura 41 Imagens capturadas com o rob posicionado em distintos pontos na regio 1. A imagem (c)
mostra somente o topo da sombra em destaque. Note que o objeto no oclui a sombra. . . 108
Figura 42 Imagens capturadas com o rob na regio 2. Note que o objeto comea a ocluir a sombra.
Todavia ainda se v a sombra do topo do objetivo e as laterais da sombra do objeto indicados
em (a). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
Figura 43 Imagens capturadas com o rob na regio 3. A sombra nesta regio aparece com um dos
lados totalmente ocluso pelo objeto. Existe uma conexo entre a parte superior do objeto e
sua sombra projetada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
Figura 44 Imagens capturadas com o rob na regio 4. A sombra nesta regio quase desaparece oclusa
pelo objeto. Contudo ainda existe uma conexo entre a parte superior do objeto e a sombra. 110
Figura 45 Imagem capturada com o rob na regio 5. A sombra do objeto no aparece na imagem por
estar totalmente oclusa. O observador est na regio equivalente ao ponto de vista da luz. . 111
Figura 46 Mapa qualitativo da disposio espacial dos objetos e a representao das regies. . . . . 112
Figura 47 Mapa qualitativo das reas de atuao divididas em oito regies. . . . . . . . . . . . . 117
Figura 48 Diagrama conceitual de vizinhana (CND) das relaes que determinam a regio na qual
o rob estava localizado. As transies esto representadas pelas setas e a mudana ocorre
sempre para uma relao (regio) vizinha. . . . . . . . . . . . . . . . . . . . . . . 118
Figura 49 Representao das regies como ns, e das transies entre regies prximas como setas:
setas contnuas regies com fronteira, tracejadas regies sem fronteira entre elas. . . . . . 119
Figura 50 Janelas para calibrao manual dos parmetros de viso utilizados no filtro de limiar para
segmentar objeto e sombra, os valores escolhidos pela barra de rolagem ficam indicados
esquerda da barra. Da esquerda para direita da figura: define o limiar T h que separa objeto e
sombra do ambiente; define o limiar que separa objeto da sombra; define o limiar que separa
a sombra do objeto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
Figura 51 Exemplo de sequncia da segmentao de um quadro na deteco ROI:(a) canal V, (b) canal
V aps limiar acima , (c) filtro morfolgico, (d) retngulo verde indica regies candidatas a
regio de interesse (ROI), (e) canal S aps filtro passa-alta sat , (f) mscara ROI. . . . . . 126
Figura 52 Exemplo de sequncia da segmentao de um quadro na deteco de objetos: (a) Imagem
objeto e sombra depois de aplicado a mscara, (b) filtro de limiar abaixo e filtro morfolgico,
(c) imagem binria da base do objeto, (d) retngulo azul indica objetos encontrados na
segmentao, (e) ltima mscara ROI criada pelo sistema de viso. . . . . . . . . . . . 128
Figura 53 Exemplo de sequncia da segmentao de um quadro na deteco de sombras: (a) Imagem
com objeto depois de aplicada a segunda mscara, (b) Imagem aps filtros de limiar acima e
morfolgico de abertura, (c) retngulo limitador vermelho indicando a sombra localizada. . 129
Figura 54 Exemplo de segmentao do objeto e sua sombra. O topo da sombra tambm detectado
pelo sistema de viso conforme destacado nesta imagem. . . . . . . . . . . . . . . . 130
Figura 55 Exemplo de sequncia da segmentao de um quadro na deteco ROI:(a) canal V, (b) canal
V aps limiar acima , (c) filtro morfolgico, (d) retngulo verde indica regies candidatas a
regio de interesse (ROI), (e) canal S aps filtro passa-alta sat , (f) mscara ROI. . . . . . 132
Figura 56 Imagem exemplo de busca de regies externamente conectadas, para cada sombra todas as
bases de objetos so verificadas onde as bordas se encontram intensidade aumenta e EC
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
verdade.
Figura 57 Imagem exemplo para definio de relaes topolgica de ocluso. . . . . . . . . . . . 138
Figura 58 O ambiente utilizado para a coleta de imagens com sombra. . . . . . . . . . . . . . . 140

Figura 59 Imagens em que o objeto e a sombra no esto completamente dentro do campo de viso do
rob. O sistema somente com raciocnio espacial no poderia inferir uma localizao a partir
. . . . . . . . . . . . . . . . . . . . . . . . . . .
dessas imagens. . . . . . . . 142
Figura 60 Ambiente utilizado para captura e auto-localizao com mltiplos objetos. . . . . . . . . 142
Figura 61 Imagens capturadas com trs pares, um par e nenhum par em cena . . . . . . . . . . . 143
Figura 62 Representao de um rob na regio 3. . . . . . . . . . . . . . . . . . . . . . . . 145
LISTA DE TABELAS
Tabela 1 Definies e interpretaes de algumas relaes do RCC. . . . . . . . . . . . . . . . 39

Tabela 2 Tabela de composio para o RCC-8 com o conjunto das relaes exclusivamente disjuntas
possveis R3 (a, c) entre a e c a partir das relaes R1 (a, b) e R2 (b, c). . . . . . . . . . 41
Tabela 3 Matriz de confuso do sensor de captura de imagem em que colunas representam o tipo de
linha divisria real enquanto que as linhas representam como a linha divisria foi classificada
pelo sistema. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
Tabela 4 Matriz de confuso dos valores de probabilidade de resposta do sensor mapa digital em
que colunas representam o tipo de rua enquanto que as linhas representam como a rua foi
classificada pelo sistema. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
Tabela 5 Tabela com oito estados dos sensores indicando as dozes possibilidades de estado do veculo
conforme representado na Figura 29. Com as coordenadas mudando relativas ao sentido de
deslocamento do carro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
Tabela 6 Resposta da rede Bayesiana representada na Figura 30 para a primeira questo: qual faixa
tem maior probabilidade do carro estar localizado. As evidncias referentes aos dados dos
trs sensores (A) esto expressas nas trs primeiras colunas. . . . . . . . . . . . . . . 90
Tabela 7 Resposta da pergunta dois a partir da rede Bayesiana da Figura 30: a probabilidade para a
direo de a faixa ser Down dado s evidncias A (expressas nas seis primeiras colunas). . 91
Tabela 8 Tabela de composio do cdc para o domnio de trfego . . . . . . . . . . . . . . . . 93
Tabela 9 Tabela que apresenta quantidade de vezes que uma faixa pode ocorrer dada a combinao
das caractersticas que podem ser percebidas pelos sensores. . . . . . . . . . . . . . . 94
Tabela 10 Resposta da primeira questo: "qual faixa tem maior probabilidade do carro estar locali-
zado?"As evidncias (A) esto expressas nas seis primeiras colunas referentes aos dados dos
trs sensores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
Tabela 11 Resposta da pergunta dois a partir da rede Bayesiana da Figura 32: a probabilidade para a
direo de a faixa ser Down dado s evidncias A (expressas nas seis primeiras colunas). . 95
Tabela 12 O modelo de movimento considerando que o rob tem uma navegao no sentido horrio.
Este modelo baseado no tamanho qualitativo e na transio das regies. O valores so
alterados por uma funo de mudana percebida w que representa a paralaxe causada pelo
movimento do rob . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
Tabela 13 Tabela com os valores que diferenciam as caractersticas em cada relao. . . . . . . . . 122
Tabela 14 O resultado do experimento de auto localizao utilizando um filtro Bayesiano e o Raciocnio

Qualitativo Perceptual sobre Sombras. . . . . . . . . . . . . . . . . . . . . . . . . 146
Tabela 15 Valores de acurcia do algoritmo baseado em conhecimento e o com o filtro Bayesiana
qualitativo, onde # imagens o nmero de imagens capturadas em cada regio. . . . . . 147
Tabela 16 Matriz de confuso com os resultados do experimento de auto localizao utilizando REQ
probabilstico. As linhas so as regies onde a imagem foi capturada e as colunas a resposta
do sistema. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
Tabela 17 Tabela com os valores de acurcia do sistema REQ probabilstico. . . . . . . . . . . . 150
Tabela 18 Tabela com os valores de acurcia do sistema detalhado por regio. . . . . . . . . . . . 151
Tabela 19 Tabela com os resultados de acurcia para o caso especfico das regies onde ocorre ocluso
nas quais somente um objeto aparecem na imagem. . . . . . . . . . . . . . . . . . . 151
Tabela 20 Resposta de total de imagens com resposta positiva para o REQ e o REQ probabilstico com
o REQ probabilstico considerando as regies vizinhas que estavam no percurso do rob
como resposta positiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
Tabela 21 Comparao que tem os valores de acurcia pelo total de objetos contidos na imagem,
considerando a regio vizinha que estava no percurso executado pelo rob como resposta
positiva. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
LISTA DE ABREVIATURAS E SIGLAS
ARIA ActivMedia Robotics Interface for Applications ou Interface robtica Activ-

Media para aplicaes.
CN D Conceptual Neighbourhood Diagram ou diagrama conceitual de vizinhaa.
CDC Clculo de Direo Cardeal.
CRALC Credal ALC.
DP C Distribuio de probabilidade condicional.
HSV Hue, Saturation, Value ou espao de cores com trs canais, matiz, saturao
e valor.
OpenCV Intel Open Source Computer Vision. Library ou biblioteca de viso compu-
tacional com cdigo aberto.
P QRS Perceptual Qualitative Relations about Shadows ou relaes perceptuais

qualitativas sobre sombras.
QSR Qualitative Spatial Reasoning ou REQ Raciocnio Espacial Qualitativo.
RCC Region Connection Calculus ou clculo sobre conexo de regio.
REQ Raciocnio Espacial Qualitativo.
RGB Red, Green, Blue ou espao de cores com trs canais, vermelho, verde e
azul.
ROC Region Occlusion Calculus ou clculo sobre ocluso de regio.
ROI Region Of Interest ou regio de interesse (regies em uma imagem).
SU RF Speeded Up Robust Features.

LISTA DE SMBOLOS
Relaes espaciais tridimensionais de ocluso.
Relaes espaciais tridimensionais de ocluso.
Relaes espaciais bidimensionais.
L Constante que representa a fonte de luz.
Scr Constante que representa a superfcie onde uma sombra projetada.
Representa o observador.
s Sombra.
sk Luminncia dos pontos na imagem do instante k.
o Objeto fsicos.
t Instante de tempo.
r Regies.
Dk Diferena da luminncia de uma imagem do instante k.

SUMRIO
1 INTRODUO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.1 Trabalhos Relacionados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.2 Organizao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2 FUNDAMENTOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.1 Robtica Cognitiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.2 Raciocnio Espacial Qualitativo . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.2.1 Clculo sobre conexo de regies . . . . . . . . . . . . . . . . . . . . 38
2.2.2 Clculo sobre ocluso de regio . . . . . . . . . . . . . . . . . . . . . 42
2.2.3 Relaes qualitativas percebveis sobre sombras . . . . . . . . . . . . . 46
2.2.3.1 Localizao relativa . . . . . . . . . . . . . . . . . . . . . . 51
2.2.3.2 Correspondncia entre objeto e sombra . . . . . . . . . . . . 53
2.2.4 Clculo de direes cardinais . . . . . . . . . . . . . . . . . . . . . . . 56
2.3 Modelos Probabilsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.3.1 Filtros Bayesianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.3.2 Redes Bayesianas relacionais . . . . . . . . . . . . . . . . . . . . . . . 61
2.4 Lgica de Descrio Probabilstica Credal ALC . . . . . . . . . . . . . . . . . 62
2.4.1 Lgica de descrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.4.2 Lgica de descrio probabilstica . . . . . . . . . . . . . . . . . . . . 63
2.4.3 Credal ALC - CRALC . . . . . . . . . . . . . . . . . . . . . . . . . . 65
2.5 Localizao Robtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
2.6 Interpretao de Imagens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
2.7 Viso Computacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
2.7.1 Espao de cores em imagens digitais . . . . . . . . . . . . . . . . . . . 72
2.7.2 Filtro de limiar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
2.7.3 Filtros morfolgicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
2.7.4 Detectores de borda . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
2.7.5 Componentes conectados . . . . . . . . . . . . . . . . . . . . . . . . . 76
I Primeira Contribuio 77
3 RACIOCNIO ESPACIAL QUALITATIVO COM LGICA DE DESCRIO PRO-

BABILSTICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.1 Descrio do Cenrio de Trfego . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.2 Definindo o Cenrio de Trfego em CRALC . . . . . . . . . . . . . . . . . . . 82
3.3 Estratgias para Soluo da Tarefa . . . . . . . . . . . . . . . . . . . . . . . . 87
3.3.1 Inferncia com uma rede Bayesiana . . . . . . . . . . . . . . . . . . . 87
3.3.2 Rede Bayesiana relacional com transitividade . . . . . . . . . . . . . . 92
3.4 Discusso dos Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
II Segunda Contribuio 97
4 RACIOCNIO ESPACIAL QUALITATIVO PROBABILSTICO PARA LOCALI-

ZAO ROBTICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.1 Um Breve Histrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.2 Mapas Qualitativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.3 Definindo a Localizao do Rob . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.3.1 Localizao na regio 1 . . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.3.6 Localizao nas regies R1 at R28 . . . . . . . . . . . . . . . . . . . . 111
4.4 Filtro Bayesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
4.4.1 Filtro Bayesiano sobre informaes qualitativas do PQRS . . . . . . . . 115
4.4.2 Filtro Bayesiano para auto localizao com mltiplos objetos . . . . . . 116
4.4.3 Modelo de imagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
4.4.4 Modelo de transio . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
4.5 Algoritmos Utilizados no Sistema de Auto Localizao . . . . . . . . . . . . . 120
4.5.1 Algoritmo de auto localizao e auto calibrao com PQRS probabilstico120
4.5.2 Algoritmo de auto localizao REQ probabilstico . . . . . . . . . . . . 123
4.5.3 Algoritmo deteco de sombra e objeto. . . . . . . . . . . . . . . . . . 124
4.5.4 Algoritmo de deteco de objetos . . . . . . . . . . . . . . . . . . . . 130
4.5.5 Algoritmo de anlise de correspondncia . . . . . . . . . . . . . . . . . 131
4.5.6 Algoritmo de reconhecimento de relaes espaciais . . . . . . . . . . . 135
5 EXPERIMENTOS EM RACIOCNIO ESPACIAL QUALITATIVO PROBABI-

LSTICO PARA AUTO LOCALIZAO DO ROB MVEL . . . . . . . . . . 139
5.1 Descrio dos Ambientes de Testes . . . . . . . . . . . . . . . . . . . . . . . . 139
5.1.1 Descrio do ambiente de teste com objeto-sombra . . . . . . . . . . . 139
5.1.2 Descrio do ambiente de teste com mltiplos objetos . . . . . . . . . . 140
5.1.3 Procedimentos de coleta de imagens com sombra-objeto . . . . . . . . 140
5.1.4 Procedimento de coleta de imagens com mltiplos objetos . . . . . . . 141
5.1.5 Modelo de imagens para sombra-objeto . . . . . . . . . . . . . . . . . 143
5.1.6 Modelo de imagem com mltiplos objetos . . . . . . . . . . . . . . . . 144
5.1.7 Teste com o sistema de auto localizao . . . . . . . . . . . . . . . . . 144
5.2 Mtodo de Avaliao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
5.3 Resultados para Auto Calibrao e Auto Localizao com Sombras . . . . . . . 145
5.4 Resultados para Auto Localizao com Mltiplos Objetos . . . . . . . . . . . . 148
5.5 Discusso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
6 CONCLUSO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
REFERNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
GLOSSRIO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
A TRABALHOS PUBLICADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

29
1 INTRODUO
No seria bom se nossos carros fossem capazes de funcionar de modo seguro no piloto
automtico, tornando acidentes de carro em algo do passado? Ou se robs domsticos fossem
assistentes inteligentes para tomar conta de reparos e cuidassem das tarefas de manuteno
e limpeza da casa? Ou fossem capazes de auxiliar no cuidado de pessoas com necessidades
especiais? Para fazer essas tarefas, um rob deve ser capaz de raciocinar sobre o mundo em
que est inserido utilizando um conhecimento a priori e dados percebidos atravs de sensores
(THRUN et al., 2005). A representao de conhecimento uma rea de Inteligncia Artificial que
trata do modo de representar e entender informaes em computadores, para que os programas
possam:
ser utilizados na obteno de informaes que esto implcitas a partir das informaes
presentes;
conversar com pessoas em linguagem natural;
planejar atividades;
resolver problemas em reas em que o conhecimento humano normalmente requerido

(SHAPIRO, 2003).
Pesquisas em representao de conhecimento comearam por volta de 1958 com a

investigao de como um computador poderia ser capaz de representar e utilizar um tipo de
conhecimento de senso comum que temos quando decidimos como ir ao aeroporto por exemplo.
Nos anos seguintes muitas pesquisas investigaram o uso das informaes dos processos de
linguagem natural. Nos anos 70 e 80s houve um interesse na pesquisa sobre o conhecimento
em domnios especficos que era executado por humanos experts, tais como diagnstico mdico
e identificao de componentes qumicos, criando a rea de pesquisa dos sistemas especialistas.
Nos anos 80s e 90s comeam pesquisar em detalhes alguns subdomnios especficos do conhe-
cimento do dia a dia, tais como as teorias de tempo e espao e em estruturas gerais do nosso
conhecimento, levando a construo de ontologias com propsitos gerais de raciocnio espacial
(SHAPIRO, 2003).
Raciocnio espacial qualitativo um subcampo de pesquisa de representao de co-
nhecimento que trata com o conhecimento sobre um domnio espacial infinito utilizando um
conjunto finito de relaes qualitativas. Um dos objetivos em particular modelar o senso
comum humano para entender o espao (WOLTER; WALLGRN, 2012). Em nosso dia a
dia a representao e raciocnio espacial tem um papel essencial. Mesmo que a abordagem
quantitativa possa providenciar informaes mais precisas, informaes numricas em geral so
30 Captulo 1. INTRODUO
desnecessrias ou indisponveis para o ser humano (CHEN et al., 2013). O Raciocnio Espacial
Qualitativo (REQ) procura formalizar o conhecimento espacial, baseado em relaes primitivas
definidas sobre entidades espaciais elementares. As teorias de raciocnio espacial utilizam muitos
modelos espaciais que, com primitivas ontolgicas e mtodos de raciocnio, predizem, explicam
e diagnosticam comportamentos de um sistema fsico de modo qualitativo, sempre que uma
avaliao quantitativa for intratvel ou no avalivel (STOCK, 1997).
Em particular as pesquisas em REQ tm aplicaes em reas tais como: sistema de
informao geogrfica (FELICE; FOGLIARONI; WALLGRN, 2011), questes de linguagem
espacial (SCHULZ et al., 2011), linguagem natural (HERMAN, 1999), entre outros campos. Em
Cohn e Hazarika (2001) e Chen et al. (2013) encontra-se um apanhado mais detalhado desta
rea. Vrios formalismos de relaes espaciais qualitativas tm sido propostos para descrever
diversos aspectos espaciais. Nesse trabalho nos concentraremos somente nos clculos espaciais
qualitativos topolgicos representados pelo clculo de conexo de regies e sua extenso o clculo
de ocluso de regies que representam as relaes entre duas regies de modo bidimensional e
tridimensional. E os clculos sobre relaes de direes como o clculo de direo cardinal que
representa a relao de direo entre duas entidades espaciais.
A necessidade de clculos que permitam uma representao e raciocnio espacial est
presente em:
planejamento e navegao robtica;
interpretao de dados de entrada visuais;
compreenso da linguagem natural.
Em todos esses casos a necessidade de representar e raciocinar sobre aspectos espaciais do

mundo uma caracterstica chave. Um desafio em aplicar o raciocnio espacial qualitativo se
encontra no fato de se tratar de teorias baseadas em lgica de primeira ordem, que sofrem
com aplicaes em mundo real devido aos rudos dos sensores, s informaes incompletas,
ou seja, com a incerteza tpica de ambientes reais. Ser capaz de raciocinar sobre a crena no
que se percebe e na probabilidade de eventos importante em muitas das aplicaes onde o
conhecimento do mundo incerto (SHIRAZI; AMIR, 2007).
Em ambiente real, um agente trabalha com incerteza devido a uma observao parcial,
ou no determinstica, ou a combinao de ambas. A probabilidade fornece um modo, de resumir
a incerteza de modo a ajudar a encontrar uma soluo provvel para o problema. O compro-
misso ontolgico da lgica e da probabilidade so os mesmos: em ambos, o mundo composto
de fatos que se fazem ou no presentes em um caso particular, contudo so epistemologicamente
diferentes: um agente lgico acredita que cada sentena verdadeira ou falsa ou no tem opinio,
enquanto que um agente probabilstico deve ter um grau de crena numrico entre 0 (falso) e
31
1 (verdadeiro). Deste modo uma lgica probabilstica representado por uma generalizao
semntica lgica cujo o valor verdadeiro da sentena um valor de probabilidade.
Na ltima dcada houve um interesse crescente em combinar raciocnio probabilstico
e teoria lgica, e em particular a lgica de descrio, a qual fragmento da lgica de primeira
ordem e teve sua origem nos anos 70s (MILCH; RUSSELL, 2007; NIKOLOV et al., 2007;
CAMPOS; COZMAN; LUNA, 2009). Essa combinao no motivada somente pelo interesse
terico puro, mas por sua relevncia do ponto de vista de aplicaes prticas, com a finalidade
de equipar um sistema de raciocnio com inferncias relacionais capazes de fazer tambm as
avaliaes probabilsticas (SANTOS et al., 2010; FENELON et al., 2010). Existem algumas
lgicas probabilsticas distintas, como as propostas em Jaeger (1994b), Sebastiani (1994a), que
foram definidas sobre um subconjunto de elementos do domnio. Estas lgicas tm dificuldade
em tratar com asseres probabilsticas para indivduos, como informao estatstica sobre o
domnio que no implica em informao sobre indivduos; isto conhecido como problema de
inferncia direta (BACCHUS et al., 1996). O problema da inferncia direta est resolvido em
Drig e Studer (2005) pela adoo de probabilidade somente nas asseres.
Um modo alternativo de contornar o problema de inferncia direta atribuir probabili-
dades a subconjuntos de interpretaes, como assumido em Laskey e Costa (2012), dmato,
Fanizzi e Lukasiewicz (2008) sendo tambm o cerne da lgica de descrio probabilstica cha-
mada credal ALC (CRALC) (COZMAN; POLASTRO, 2008) que foi utilizada neste trabalho
(SANTOS et al., 2010; FENELON et al., 2010). O CRALC uma extenso probabilstica da
lgica de descrio ALC e como esta baseada em conceitos, os quais representam conjuntos de
indivduos (tais como, Planta e Animal); e papis, os quais representam relaes entre dois indi-
vduos (tais como, paiDe ou amigoDe). Tambm tem um conjunto de operadores de interseco,
unio e complemento alm de alguns quantificadores (POLASTRO, 2012).
Para a localizao robtica os mtodos que tm maior sucesso so os que utilizam
algoritmos probabilsticos, que so em geral criados sobre mtodos de filtro Bayesiano (THRUN
et al., 2005). Os filtros Bayesianos so algoritmos recursivos composto de duas etapas: a
previso e a atualizao de medidas. A localizao consiste em localizar as coordenadas de um
rob relativo ao ambiente externo que em geral representado por um mapa. O mapeamento
robtico aborda o problema de aquisio de modelos espaciais dos ambientes fsicos atravs
de robs mveis. Esse problema em geral considerado importante quando se busca um rob
mvel realmente autnomo. Apesar dos progressos significativos nesta rea, ele ainda apresenta
grandes desafios. Um problema que pode ocorrer utilizando esses algoritmos - a crena acabar
convergindo para uma posio errada causado por informaes ruidosas deixando a localizao
comprometida, em alguns casos o rob fica perdido ou toma decises que so arriscadas
integridade fsica local e do rob. Neste trabalho os mapas so mapas fornecidos para o rob, as
regies do mapa qualitativo so definidas pelo tipo de relaes percebidas entre os elementos
do domnio. Pesquisas sobre abordagens e aplicaes de localizao robtica probabilstica e
mapeamento podem ser encontradas em Thrun et al. (2005) e Thrun (2002) respectivamente.
O objetivo deste trabalho desenvolver um sistema de raciocnio espacial que seja capaz
de trabalhar com incertezas e investigar sua aplicabilidade para a interpretao de cenas em
ambientes envolvendo o movimento de veculos. Para que este objetivo seja atingido, as seguintes
tarefas foram cumpridas:
1. Estudo das lgicas de descrio probabilsticas e formalismos de raciocnio espacial

qualitativo (REQ).
2. Desenvolvimento de uma teoria lgica probabilstica que permita representar cenas em

termos de raciocnio espacial qualitativo (REQ).
3. Combinao de diferentes clculos de raciocnio espacial com um filtro Bayesiano.
4. Desenvolvimento de filtro Bayesiano com informao qualitativa no problema de auto

localizao robtica qualitativa.
5. Validao emprica do sistema desenvolvido a partir de testes com um rob.
Uma lgica de raciocnio espacial qualitativo com probabilidade deve tornar um sistema
de inferncia mais robusto para tratar com ambientes reais. As teorias de raciocnio espacial
qualitativo capacitam um sistema de inteligncia artificial inferir informaes sobre o ambiente
tridimensional a partir de imagens, enquanto que tcnicas probabilsticas auxiliam no tratamento
de incertezas causadas pela falta de informao ou por informaes parciais.
Para utilizar o raciocnio espacial qualitativo com lgica de descrio probabilstica,
utilizamos parte de um domnio de trfego baseado no trabalho realizado por Hummel (2009),
a qual j havia utilizado uma lgica de descrio como um formalismo de representao do
conhecimento com raciocnio espacial para entender cena de um domnio de trfego urbano.
Investigou-se como formalizar esse domnio restrito de trfego com a lgica de descrio
probabilstica CRALC (COZMAN; POLASTRO, 2008). Neste caso tratamos do problema
restrito s informaes disponveis a partir de sensores acoplados ao veculo e do conhecimento
do domnio, inferindo uma nova informao tal como a faixa na qual o veculo estaria localizado.
Realizamos as primeiras anlises para descobrir como seria possvel combinar uma interpretao
com lgica de descrio probabilstica e o raciocnio espacial aplicveis em um rob mvel
(carro autnomo mvel) (FENELON et al., 2010; SANTOS et al., 2010). O captulo 3 contm
mais detalhes sobre a utilizao do CRALC neste ambiente. Esse domnio serviu para uma
primeira abordagem do uso de raciocnio espacial qualitativo com probabilidade.
Buscando uma aplicao com dados reais, estendeu-se com uma abordagem probabils-
tica um sistema de auto localizao previamente desenvolvido em trabalhos anteriores (SANTOS;
DEE; FENELON, 2008; SANTOS; DEE; FENELON, 2009). O sistema trata do problema re-
ferente ao rob inferir sua localizao qualitativa a partir da sua percepo visual das relaes
dos elementos alvos no ambiente. Contudo o mecanismo de inferncia lgica sofria pela falta
33
de informao e pelo rudo dos dados do sistema de viso. Sem a capacidade para lidar com
incerteza esses sistema estava a espera de um sistema de viso sem rudos ou com aplicao
somente tericas em ambientes simulados e ou extremamente controlados. Este trabalho est
dividido em duas partes em que como contribuio geral integraram sistemas de raciocnio
espacial qualitativos com mtodos de raciocnios probabilsticos.
Primeira contribuio: criar um mtodo para combinar o clculo de direes cardinais uti-
lizado em um domnio de trfego (HUMMEL; THIEMANN; LULCHEVA, 2008) com
raciocnio probabilstico usando redes Bayesianas, em particular utilizando a lgica de des-
crio probabilstica CRALC (captulo 3) (SANTOS et al., 2010; FENELON et al., 2010).
Com os estudos realizados com CRALC como contribuio constatamos alguns pontos
que so essenciais para aplicao de CRALC em um sistema robtico com raciocnio
espacial, tal como a introduo de uma hierarquia de papis que permita fazer composio
de relaes (seo 2.2.1) .
Segunda contribuio: a mais importante, na qual foi proposto e utilizado um mtodo que
combina filtro Bayesiano com as lgicas de raciocnio espacial qualitativo que tratam de
ocluso, tal como as relaes espaciais qualitativas percebidas sobre sombras ou aquelas
percebidas entre objetos. O mtodo foi aplicado em sistemas de auto localizao utilizando
dados de imagens capturadas no ambiente real pelo rob mvel P eopleBotT M (captulos
4 e 5) (FENELON et al., 2013).
As contribuies acima mencionadas foram temas em artigos publicados durante o

doutorado. Os trabalhos relatados nestes artigos fazem parte dessa tese, o resumo destes artigos
est transcrito no anexo A. Os ttulos seguem relacionados abaixo em ordem cronolgica:
Probabilistic logic encoding of spatial domains (SANTOS et al., 2010).
Encoding spatial domains with relational Bayesian networks (FENELON et al., 2010).
Reasoning about shadows in a mobile robot environment (FENELON et al., 2012).
Reconhecimento de Objetos Baseado em Contexto Utilizando a Lgica de Descrio

Probabilstica (FENELON-PEREIRA; SANTOS; COZMAN, 2012).
A Qualitative-Probabilistic Approach to Autonomous Mobile Robot Self Localisation and

Self Vision Calibration (FENELON et al., 2013)
Neste trabalho existem duas abordagens. Em comum existe um problema de localizao

sendo tratado utilizando algum tipo de raciocnio espacial qualitativo em uma abordagem
probabilstica. A primeira abordagem com lgica de descrio probabilstica com clculo de
direo cardinal, a localizao do veculo no temporal e os dados para experimentos so
simulados. Na segunda abordagem a localizao de um rob foi realizada a partir de dados
extrados de imagens capturadas pelo rob mvel enquanto navegava pelo ambiente, o sistema foi
desenvolvido baseado na formalizao sobre as relaes de ocluso entre elementos do domnio
combinado com um filtro Bayesiano. Apesar das semelhanas so dois problemas distintos e no
existe uma comparao possvel entre eles sobre seus resultados.
1.1 Trabalhos Relacionados

No estado da arte podemos encontrar alguns trabalhos onde as relaes espaciais quali-
tativas so definidas com uma lgica de descrio (GUO; ZHANG, 2009; LUNA; CAMPOS;
COZMAN, 2007; CRISTANI; GABRIELLI, 2009). Eles se concentraram no estudo terico
sem aplicar a nenhum problema em especfico. Em nossa investigao utilizamos uma lgica de
descrio probabilstica para definir um domnio com base nas relaes espaciais qualitativas
(FENELON et al., 2010; SANTOS et al., 2010). Com o conhecimento adquirido nos estudos
citados acima, direcionamos nossos esforos para viabilizar um sistema desenvolvido para auto
localizao de um rob mvel utilizando sombras (FENELON et al., 2012).
O domnio formalizado utilizando a teoria das Relaes Qualitativas Percebveis sobre
Sombras, a qual utiliza os dados de um sistema de viso que definem as relaes entre a sombra
e o objeto percebidas por um observador. Em Fenelon et al. (2012) um sistema de auto calibrao
foi proposto onde a partir do movimento do rob, ele mantinha uma crena de: ou continuar na
mesma regio, ou mudar para uma das regies vizinhas. Com isso caso o parmetro de viso
no correspondesse crena do rob, o sistema mudaria o parmetro at encontrar um que
confirmasse sua crena da localizao. Todavia este sistema de calibrao no funciona onde
a imagem no tem informao ou estas esto incompletas (imagem sem sombra ou objeto). A
abordagem probabilstica que melhor se encaixou para tratar com as incertezas desse caso de
auto localizao e auto calibrao foi um filtro Bayesiano (FENELON et al., 2013).
Para realizar a tarefa de localizao as regies so definidas por linhas de viso, que
podem ser informalmente descritas como linhas tangenciais aos objetos chaves. Isto similar ao
encontrado em Fogliaroni et al. (2009), o qual props um modelo para navegao qualitativa de
um agente autnomo. Em seu modelo Fogliaroni et al. (2009) considera objetos convexos como
pontos de referncias e o espao navegvel decomposto em regies. Mais especificamente, este
modelo gera regies em termos de pores de regies que so visveis, parcialmente visveis e
oclusas. A ordem em que os objetos so observados tambm usada para qualificar as regies. Em
contraste com Fogliaroni et al. (2009) neste trabalho as teorias de raciocnio espacial qualitativo
foram aplicadas em um domnio de rob mvel, na execuo da tarefa de auto localizao com
uma abordagem probabilstica para tratar com incertezas encontradas em ambientes reais.
Outro trabalho prximo ao descrito aqui encontrado em Sj, Aydemir e Jensfelt (2012),
no qual se utilizam duas relaes "on" (sobre) e "in" (dentro), as quais permitem um sistema
robtico mvel analisar a cena e servem como guia na localizao de objetos por viso. Sj,
1.2. Organizao 35
Aydemir e Jensfelt (2012) defende que as teorias de raciocnio espaciais qualitativos, por serem
formalizados em geral em lgica de primeira ordem, so aplicveis em sistemas computacionais,
mas no so adaptveis aos sistemas robticos mveis que estejam em ambientes com incerteza.
Entretanto este trabalho mostra que as teorias de raciocnio espacial so aplicveis em robtica
combinando com tcnicas probabilsticas. Alm disso, este trabalho no est restrito somente
a relaes topolgicas: tal como o clculo de conexo de regies e suas extenses, tambm
clculos de direo e informaes de distncia foram utilizados. As incertezas so tratadas com
um filtro Bayesiano que intuitivamente mantm uma crena na continuidade das aes do rob
no mundo. Outra diferena entre nossos trabalhos que estamos aplicando na tarefa de auto
localizao qualitativa.
1.2 Organizao
O captulo 2 apresenta um breve relato do atual estado da arte e as teorias envolvidas neste
estudo (raciocnio espacial qualitativo, probabilidade Bayesiana, lgica de descrio probabils-
tica, assim como algumas tcnicas de viso computacional), procurando sempre relacionar com
os objetivos dessa investigao. O captulo 3 descreve nossas primeiras investigaes implemen-
tando um domnio de trfego formalizado em lgica de descrio probabilstica com um clculo
de direes cardinais, onde analisamos como utilizar o CRALC e como poderamos associar
probabilidades em sistemas lgicos espaciais, visando aplicao em agentes mveis autnomos.
No captulo 4, a partir das concluses derivadas dos experimentos preliminares, comeamos o
desenvolvimento de uma extenso probabilstica de um sistema de auto localizao para um
rob mvel utilizando raciocnio espacial qualitativo. O captulo 5 apresenta os resultados e
discusses a respeito do sistema de auto localizao qualitativa para um rob mvel. Enfim a
concluso e trabalhos futuros so encontrados no captulo 6.
37
2 FUNDAMENTOS
Este captulo descreve as teorias que foram utilizadas nesta pesquisa. Grande parte de
nossas investigaes envolve alguma teoria ou conceito de Raciocnio Espacial Qualitativo
(REQ)1 (seo 2.2) (STOCK, 1997), tais como: clculo sobre conexo de regies2 (seo 2.2.1)
(RANDELL; CUI; COHN, 1992), clculo sobre ocluso de regio3 (seo 2.2.2) (RANDELL;
WITKOWSKI; SHANAHAN, 2001) que so base para uma teoria mais especfica chamada
relaes qualitativas percebveis sobre sombras4 (seo 2.2.3) (SANTOS; DEE; FENELON,
2008) e o clculo de direo cardinal5 (seo 2.2.4) (FRANK, 1996). O raciocnio espacial
qualitativo utilizado por um agente munido de viso computacional para interpretao do
mundo tridimensional a partir de informaes de imagens bidimensionais (seo 2.2). A captura
de informaes ou mesmo a representao do conhecimento do mundo real tem a incerteza como
caracterstica intrnseca. Apesar de uma abordagem qualitativa ser uma tcnica que trata com
certo grau de incerteza, ainda assim em algumas situaes no possvel representar as relaes
qualitativas apropriadamente (CHEN et al., 2013).
Para tratar com incerteza as abordagens probabilsticas (seo 2.3) utilizadas foram:
as redes Bayesianas relacionais e um filtro Bayesiano. As redes Bayesianas relacionais fazem
parte do mecanismo de inferncia da lgica de descrio probabilstica Credal ALC (CRALC)
(seo 2.4) (COZMAN; POLASTRO, 2008). Tambm so abordados brevemente alguns tpicos
relacionados s tarefas propostas, tais como: localizao robtica (seo 2.5), interpretao de
imagens (seo 2.6) e viso computacional (seo 2.7).
2.1 Robtica Cognitiva

Um desafio da robtica cognitiva a integrao de todos os nveis de uma arquitetura de
controle que envolva, desde a execuo e escolha de uma formalizao integrada at os aspectos
cognitivos, incluindo o de decidir qual tarefa executar e como executar (PIRRI; MENTUCCIA;
STORRI, 2003). Um rob mvel autnomo trabalha continuamente com percepo e ao
(NEHMZOW, 2003), assim um rob domstico que tivesse que executar tarefas como cuidar de
sua recarga de bateria, controlar a temperatura da casa, abrir a porta quando a campainha toca,
teria que ter uma percepo do que est acontecendo na casa, e de si mesmo, e em situaes onde
necessrio executar tarefas concorrentes. Vrios estudos so realizados buscando desenvolver
tcnicas melhores para capacitar um rob a executar tarefas diversas de modo autnomo. Kanda
1
Do ingls: Qualitative Spatial Reasoning (QSR)
2
Do ingls: Regions Connection Calculus (RCC)
3
Do ingls: Region Occlusion Calculus (ROC)
4
Do ingls: Perceptual Qualitative Relations about Shadows (PQRS)
5
Do ingls: Cardinal Direction Calculus (CDC)
38 Captulo 2. FUNDAMENTOS
et al. (2006) realizou pesquisas com robs interagindo com pessoas, procurando melhorar a
maneira das mquinas executarem tarefas de modo aceitvel e confivel para os humanos.
Pesquisas com foco em utilizar a percepo robtica so relatadas em Scherl e Levesque (1993)
o qual utilizou as informaes percebidas pelo rob para produzir conhecimento a partir de suas
aes, enquanto que em Santos e Shanahan (2002a) os dados coletados pelos sensores do rob
mvel serviram de base para a construo de um sistema de raciocnio espacial. Essas pesquisas
so em geral realizadas em ambientes controlados ou executando apenas tarefas especficas.
Ambientes controlados so utilizados em robtica devido ao elevado grau de incerteza que existe
em ambientes humanos dinmicos. Alguns pesquisadores acreditam que poderemos elevar a
capacidade cognitiva robtica agregando os vrios algoritmos desenvolvidos para efetuar diversas
tarefas (MCCARTHY, 2007).
2.2 Raciocnio Espacial Qualitativo

O objetivo da rea de raciocnio espacial qualitativo (REQ) a formalizao do conheci-
mento espacial a partir de entidades elementares tais como regies espaciais (RANDELL; CUI;
COHN, 1992), segmentos de linha (MORATZ; RENZ; WOLTER, 2000; SCHLIEDER, 1996),
direes (FREKSA, 1992; LIGOZAT, 1998), entre outras (STOCK, 1997; COHN; HAZARIKA,
2001; CHEN et al., 2013). Uma sntese mais completa neste campo pode ser encontrada em
(COHN; HAZARIKA, 2001; CHEN et al., 2013). Comearemos pelo clculo sobre conexo
de regies que uma das teorias mais conhecidas para representar e raciocinar com relaes
topolgicas, alm de ser a base para outras abordagens em raciocnio espacial qualitativo (CHEN
et al., 2013).
2.2.1 Clculo sobre conexo de regies

Region Connection Calculus (RCC) (RANDELL; CUI; COHN, 1992) ou clculo sobre
conexo de regies um sistema axiomtico sobre regies espaciais em lgica de primeira
ordem, que tem como base uma relao primitiva binria de conectividade simtrica e reflexiva.
Para um melhor entendimento, dadas duas regies x e y, a relao C(x, y) representa que x
est conectado com y sendo verdadeira se somente se as regies x e y tiverem pelo menos um
ponto em comum. A relao de conectividade obedece aos seguintes axiomas (RANDELL; CUI;
COHN, 1992; GOTTS, 1994):
x C(x, x);
x y C(x, y) C(y, x).
Assumindo a relao binria C/2 e as variveis x, y e z para regies espaciais define-se diferentes
relaes entre pares. A definio de algumas dessas relaes e suas interpretaes podem ser
vistas na Tabela 1 (RANDELL; CUI; COHN, 1992; RENZ, 2002). As relaes DC, EQ,
2.2. Raciocnio Espacial Qualitativo 39
Tabela 1: Definies e interpretaes de algumas relaes do RCC.

Definio da relao Interpretao
DC(x, y) def C(x, y) x est desconectado de y
P (x, y) def z[C(z, x) C(z, y)] x parte de y
P P (x, y) def P (x, y) P (y, x) x parte prpria de y
EQ(x, y) def P (x, y) P (y, x) x = y: x idntico a y
O(x, y) def z[P (z, x) P (z, y)] x sobrepe y
P O(x, y) def O(x, y) P (x, y) P (y, x) x sobrepe parcialmente y
DR(x, y) def O(x, y) x distinta de y
EC(x, y) def C(x, y) O(x, y) x est externamente conectado y
T P P (x, y) def P P (x, y) z[EC(z, x) EC(z, y)] x uma parte prpria tangencial de y
N T P P (x, y) def P P (x, y) z[EC(z, x) EC(z, y)] x uma parte prpria no tangencial de y
P I(x, y) def P (y, x) y parte de x
P P I(x, y) def P P (y, x) y parte prpria de x
T P P I(x, y) def T P P (y, x) y uma parte prpria tangencial de x
N T P P I(x, y) def N T P P (y, x) y uma parte prpria no tangencial de x
fonte:Randell, Cui e Cohn (1992), Renz (2002).
Figura 1: Diagrama conceitual de vizinhana (CND - Conceptual Neighborhood Diagram) das relaes RCC-8.
Note a continuidade das transies topolgicas entre regies (indicadas pelas setas), as mudanas de relaes
ocorrem sempre para uma relao vizinha.
Fonte: adaptada de Cui, Cohn e Randell (1992).
P O, EC, T P P , N T P P , T P P I e N T P P I formam um conjunto de relaes mutuamente

excludentes e disjuntas par a par. Este conjunto referido como RCC-8 (RANDELL; CUI;
COHN, 1992; STOCK, 1997; RENZ, 2002).
No contexto do raciocnio espacial qualitativo assume-se que as mudanas das relaes
entre regies ocorrem de forma contnua. Todas as transies topolgicas entre regies so
contnuas, ou seja, quando uma relao muda, essa mudana segue sempre para uma relao
prxima ou vizinha. Na Figura 1 vemos uma representao grfica de vizinhana das oito
relaes bsicas do RCC (RCC-8). Nessa mesma figura as transies so representadas pelas
setas; essa representao conhecida como diagrama conceitual de vizinhana (CND) (CUI;
COHN; RANDELL, 1992; RANDELL; CUI; COHN, 1992). A continuidade nas transies das
relaes um conceito importante, fazendo com que o CND seja uma importante ferramenta
para raciocinar em vrias situaes (STOCK, 1997).
Outra ferramenta para representar e raciocinar sobre as disjunes e conjunes de pares
do conjunto de relaes binrias, tanto espacial quanto temporal, a tabela de composio
(RANDELL; WITKOWSKI, 2002). Esta tabela contm as transitividades entre trs regies
distintas a,b e c, onde, dadas informaes sobre as relaes entre a e b e entre b e c, se extrai um
conjunto de relaes possveis entre as regies a e c. A Tabela 2 uma tabela de composio
para RCC-8, onde a primeira coluna representa as relaes entre a e b (R1 (a, b)) e a primeira
linha as relaes entre b e c (R2 (b, c)). O conjunto das relaes possveis entre a e c (R3 (a, c))
esto representadas nas clulas definidas pela interseco entre a coluna de R1 (a, b) e a linha de
R2 (b, c) (RANDELL; WITKOWSKI, 2002).
Para exemplificar tanto a transitividade quanto a transio de relaes utilizaremos um
exemplo grfico (Figura 2). Considerando as relaes entre as trs regies (a, b e c) representadas
esquerda da Figura 2, onde R1 (a, b) uma relao N T P P (a, b), caso ocorra uma transio da
relao R1 (a, b) pelo diagrama conceitual de vizinhana a prxima relao seria ou EQ(a, b)
ou T P P (a, b), na Figura 2 a relao mudou para T P P (a, b), enquanto que a relao R2 (b, c)
(T P P (b, c)) permaneceu igual. Nesta mesma figura tambm est representada a transitividade
entre as trs regies (a, b e c). Pode se observar duas composies: a esquerda note que com-
posio das relaes N T P P (a, b) e T P P (b, c) resultam na relao N T P P (a, c), enquanto a
direita a composio resultante entre T P P (a, b) e T P P (b, c) so as duas relaes N T P P (a, c)
e T P P (a, c) referentes s duas possveis transies. Esses resultados esto expressos na tabela
de composio (Tabela 2).
A tabela de composio e o diagrama conceitual de vizinhana so ferramentas de
inferncia aplicveis com outros clculos espaciais. Neste trabalho o conceito de transio foi
utilizado para inferir mudana de posio em relao ao contexto onde um observador est, ou
seja, esse conceito de continuidade e vizinhana foi utilizado na criao do modelo de transio
do sistema de auto localizao (seo 4.4.4) (FENELON et al., 2013). A tabela de composio
serve para inferir uma relao entre indivduos em contextos nos quais essas relaes no so
percebidas diretamente pelos sensores. Neste trabalho, utilizamos uma tabela de composio
para inferir relaes entre um veculo e faixa da rua, das relaes entre o veculo e linha divisria,
e da faixa e a linha divisria a partir das relaes percebidas, de informaes do domnio e dos
sensores (seo 3.2) (FENELON et al., 2010).
O clculo de conexo de regies (RCC) representa as relaes mereotopolgicas entre
regies espaciais que so independentes do ponto de vista do observador. Isto diferente
do clculo de linhas visuais (lines-of-sight calculus) (GALTON, 1994) que a partir de um
ponto de vista representa as posies relativas entre pares de corpos convexos no sobrepostos.
Inspirado pelo clculo de linhas visuais foi criada uma teoria conhecida como clculo sobre
ocluso de regio (RANDELL; WITKOWSKI; SHANAHAN, 2001), a qual uma extenso
do RCC (RANDELL; CUI; COHN, 1992), proposta para representar as vrias possibilidades
de interposies entre quaisquer objetos dependendo do ponto de vista do observador. A seguir
descreve-se brevemente esta teoria.
Tabela 2: Tabela de composio para o RCC-8 com o conjunto das relaes exclusivamente disjuntas possveis
R3 (a, c) entre a e c a partir das relaes R1 (a, b) e R2 (b, c).
R2 (b, c)
R1 (a, b) DC EC PO TPP TPPI EQ NTPP NTPPI
DC DC EC DC EC DC EC DC EC DC DC DC EC DC
PO TPP PO TPP PO TPP PO TPP PO TPP
TPPI EQ NTPP NTPP NTPP NTPP
NTPP
NTPPI
EC DC EC DC EC
DC EC EC PO DC EC EC PO TPP DC
PO TPPI PO TPPI
PO TPP TPP NTPP
NTPPI TPPI EQ
NTPP NTPP
PO DC EC DC EC
DC EC PO TPP DC EC PO PO TPP DC EC
PO TPPI PO TPPI
PO TPP NTPP PO TPPI NTPP PO TPPI
NTPPI NTPPI
TPPI EQ NTPPI
NTPP
NTPPI
TPP DC DC EC DC EC TPP DC EC TPP NTPP
DC EC
PO TPP NTPP PO TPP PO TPPI
NTPP TPPI EQ NTPPI
TPPI DC EC EC PO PO TPPI PO TPP TPPI TPPI PO TPP NTPPI
PO TPPI TPPI NTPPI TPPI EQ NTPPI NTPP
NTPPI NTPPI
EQ DC EC PO TPP TPPI EQ
NTTPI NTPP
NTPP DC DC DC EC NTPP DC EC NTPP
DC EC NTPP
PO TPP PO TPP
PO TPP
NTPP NTPP
TPPI EQ
NTPP
NTPPI
NTPPI DC EC PO TPPI PO TPPI PO TPPI NTPPI NTPPI PO TPP NTPPI
PO TPPI NTPPI NTPPI NTPPI TPPI EQ
NTPPI NTPP
NTPPI
Fonte Randell e Witkowski (2002).
Figura 2: Representao grfica das composies R1 (a, b) e R2 (b, c) antes e depois da transio representada
pela seta, note que o conjunto resultante R3 (a, c) so as relaes possveis (Tabela 2).
Fonte: autor.
Figura 3: Duas sequncias de imagens (da esquerda para direita) onde um cone passa em frente (sequncia
superior) e por trs (sequncia inferior) do cilindro, este um exemplo da ocluso em ao. Note na ocorrncia de
ocluso os dois objetos formam uma nica regio na imagem.
Fonte: autor.
2.2.2 Clculo sobre ocluso de regio
Region occlusion calculus (ROC) (RANDELL; WITKOWSKI; SHANAHAN, 2001) ou

clculo sobre ocluso de regio representa os eventos ou relaes de ocluso espacial. A ocluso
espacial ocorre quando um corpo se interpe a outro a partir de um ponto de vista. Eventos
de ocluso nos ajudam a determinar onde est o contorno de um objeto, ou inferir por que um
objeto no pode ser visto e o que precisamos fazer para torn-lo visvel. O ROC estende o RCC-8
para raciocinar sobre distncias relativas entre dois corpos a partir dos eventos de ocluso e a
transio entre relaes de ocluso.
O ROC pode ser usado para modelar o efeito de paralaxe causado por ambos os mo-
vimentos do objeto ou do observador. Como exemplo, vamos considerar que as imagens dos
objetos so regies. Note que, na Figura 3, quando ocorre uma ocluso, nas imagens os objetos
aparecem formando uma nica regio. O ROC capacita inferncia de que existem (neste caso)
dois objetos sob alguma relao de ocluso.
Um evento de ocluso espacial pode ser visto na Figura 3 com movimento realizado pelo
objeto. A partir de um ponto de vista fixo: o objeto cnico passa pela frente do objeto cilndrico
na sequncia superior da imagem, enquanto que na sequncia inferior passa por trs (Figura 3).
As transies das relaes ROC podem ajudar a determinar modelos de movimento, pois quando
se muda o ponto de vista ocorre paralaxe (Figura 4), essa informao pode ser utilizada para
derivar um modelo objetivo do mundo de um ponto de vista naturalmente restrito (RANDELL;
WITKOWSKI; SHANAHAN, 2001). Para distinguir entre um corpo fsico e a regio do espao
por ele ocupada, e distinguir entre um corpo fsico e sua projeo em relao a um ponto de
vista, o ROC utiliza-se de duas funes: region e image. Pode-se entender a funo region
como o mapeamento de um corpo fsico e sua regio de ocupao. A funo image representa o
mapeamento relativo a uma projeo bidimensional do corpo fsico a partir de um determinado
Figura 4: Mudana na percepo da ocluso causada pelo movimento do observador (paralaxe).
Fonte: adaptado de (RANDELL; WITKOWSKI; SHANAHAN, 2001).
ponto de vista. A distino formal apresentada pelas duas funes: region(x) lida como a
regio ocupada por x e image(x, ) lida como a imagem de x em relao ao ponto de vista
(RANDELL; WITKOWSKI, 2002).
Com a relao primitiva T otallyOccludes(x, y, ) define-se um evento de ocluso total
entre dois corpos, essa relao lida como "x oclui totalmente y com relao ao ponto de vista
". TotallyOccludes/3 axiomatizada como transitiva e irreflexiva (RANDELL; WITKOWSKI;
SHANAHAN, 2001). Para descrever o significado geomtrico de uma ocluso total, considere
que uma linha(p1 , p2 , p3 ) definida de modo que, os pontos p1 , p2 e p3 estejam em uma reta,
com p2 posicionado estritamente entre p1 e p3 . Ento, uma regio x oclui totalmente uma regio
y do ponto de vista se e somente se para todo o ponto p em y, existir um ponto q em x tal que
linha(, q, p) seja verdade e no exista nenhum outro ponto p0 em y e q 0 em x, com os quais
linha(, p0 , q 0 ) seja verdadeiro. Vrios axiomas que constituem o ROC sero apresentados a
seguir (RANDELL; WITKOWSKI; SHANAHAN, 2001):
x y z [[T otallyOccludes(x, y, ) P (region(z), region(y))]

T otallyOccludes(x, z, )], (2.1)
isto , se x oclui totalmente y, x oclui totalmente qualquer parte de y.
x y [T otallyOccludes(x, y, ) z [P (region(z), region(y))]

T otallyOccludes(z, x, )], (2.2)
Figura 5: Modelo grfico das 20 relaes bsicas do clculo sobre ocluso de regio, o ROC-20.
Fonte:Randell e Witkowski (2002).
isto , se x oclui totalmente y nenhuma parte de y oclui totalmente x.
x y [T otallyOccludes(x, y, )
z u [[P (region(z), region(x)) P (region(u), region(y))]
T otallyOccludes(u, z, )]], (2.3)
isto , se x oclui totalmente y nenhuma parte de y oclui totalmente parte de x.
x y z [P (region(y), region(x)) P (region(z), region(x))

T otallyOccludes(y, z, )], (2.4)
isto , todo x tem uma parte que oclui totalmente outra parte de x. Este axioma garante que o
corpo tem profundidade.
x y [T otallyOccludes(x, y, ) P (image(y, ), image(x, ))], (2.5)
isto , se x oclui totalmente y, a imagem de y parte da imagem de x.

A seguir define-se uma relao de ocluso enfraquecida como Occludes(x, y, ) a qual

lida como x oclui y com relao ao ponto de vista , utilizada para incluir outras relaes de
ocluso mais especficas tais como as ocluses parcial e mtua:
Occludes(x, y, ) z u [P (region(z), region(x)) P (region(u), region(y))

T otallyOccludes(z, u, )], (2.6)
isto , x oclui y do ponto de vista se pelo menos existe uma parte de x que oclui totalmente
pelo menos uma parte de y.
P artiallyOccludes(x, y, ) Occludes(x, y, ) T otallyOccludes(x, y, )

Occludes(y, x, ), (2.7)
isto , x oclui parcialmente y do ponto de vista , mas y no oclui x.
M utuallyOccludes(x, y, ) Occludes(x, y, ) Occludes(y, x, ), (2.8)
isto , x e y ocluem um ao outro do ponto de vista .

No clculo sobre ocluso de regio (ROC) tambm ocorrem as relaes inversas iden-
tificas pelo expoente 1. Essas relaes so encontradas em Randell, Witkowski e Shanahan
(2001), Randell e Witkowski (2002) e no sero listadas aqui. O ROC reduz a descrio de ali-
nhamentos possveis entre os objetos a vinte relaes bsicas. Por isso, esse clculo conhecido
tambm por ROC-20 (WITKOWSKI et al., 2001; RANDELL; WITKOWSKI, 2002). A Figura
5 uma representao grfica dessas vinte relaes. O ROC-20 (RANDELL; WITKOWSKI;
SHANAHAN, 2001) utiliza um conjunto de relaes binrias baseado no RCC-8 (RANDELL;
CUI; COHN, 1992) e estende o clculo de linhas visuais (GALTON, 1994), para modelar o
relacionamento espacial entre corpos no espao tridimensional e suas imagens bidimensionais,
as quais so obtidas a partir de um ponto de vista. Essas relaes so definidas pelo esquema de
axiomas abaixo (RANDELL; WITKOWSKI; SHANAHAN, 2001).
(x, y, ) (x, y, ) (image(x, ), image(y, )) ;

1 (x, y, ) (y, x, ) (image(y, ), image(x, ));
onde:
= N onOccludes, ento {DC, EC};
= T otallyOccludes, ento {EQ, T T P I, N T P P I};
= P artiallyOccludes,ento {P O, T P P, N T P P };
= M utuallyOccludes, ento {P O, EQ, T P P, N T P P };
e onde:
= T otallyOccludes, ento {EQ, T P P I, N T P P I};
= P artiallyOccludes, ento {P O, T P P, N T P P };
= M utuallyOccludes, ento {T P P, N T P P }.
Figura 6: Estudos sobre sombra de Leonardo da Vinci. No esboo v-se representados as sombras do objeto
projetadas em outra superfcie (sombra-projetada) e no prprio objeto (sombra-prpria).
Fonte:Vinci (1970).
Com os axiomas acima as relaes de ocluso em ambiente tridimensional podem ser

interpretadas em um plano. Assim, analisando as relaes espaciais que ocorrem entre regies
distintas em uma imagem podemos deduzir as relaes espaciais no ambiente real, incorporando
uma noo de profundidade e distncia comparativa entre os objetos. Profundidade e distncia
ambas so essenciais em teorias lgicas quando utilizadas em aplicaes prticas em robtica
(WITKOWSKI et al., 2001).
Neste trabalho, o mecanismo de inferncia de auto localizao extraiu informaes do
ambiente a partir das relaes percebidas nas imagens capturadas por um rob (captulo 4). Deste
modo, o ROC esteve presente na formalizao tanto dos eventos de ocluso entre objetos quanto
dos eventos de ocluso entre objeto e sombra. Considerando as relaes ROC entre objeto e
sombra a partir de um ponto de vista, foi proposta em Santos, Dee e Fenelon (2008), Santos,
Dee e Fenelon (2009) uma nova teoria de raciocnio espacial, especfica sobre informaes de
sombras, chamada de Relaes qualitativas percebveis sobre sombras (Perceptual Qualitative
Relations about Shadows - PQRS), a qual ser descrita a seguir.
2.2.3 Relaes qualitativas percebveis sobre sombras

Para uma breve definio, uma sombra formada quando a luz obstruda, em sua
trajetria, por um objeto opaco. Ela pode ser classificada em sombra-prpria e sombra-projetada.
A sombra-projetada aquela que ocorre quando a sombra forma-se em uma superfcie, enquanto
que na sombra-prpria a superfcie de projeo o prprio objeto que a provocou (Figura 6), uma
anlise da estrutura geomtrica das sombras pode ser encontrada em Knill, Mamassian e Kersten
(1997). Concentraremos na sombra-projetada que ser referida neste trabalho somente como
sombra. Para se formar uma sombra necessria combinao de trs elementos bsicos. Esses
elementos so a fonte de luz, a superfcie na qual a sombra projetada e um objeto opaco. Um
observador e cada um desses elementos so importantes, pois, qualquer alterao na localizao
de algum destes provocar um movimento da sombra.
Figura 7: Efeito na localizao do objeto ocasionado pela posio da sombra.
Fonte:Kersten, Mamassian e Knill (1994).
Na Figura 7 aparecem trs imagens que (quando mostradas em sequncia) do a impres-

so errnea de que o quadrado do meio move-se em profundidade, enquanto que de fato somente
a sombra se movimenta. O curioso que o movimento da sombra poderia ser ocasionado tanto
pelo movimento do observador, ou pelo movimento da superfcie na qual est projetada, ou
devido fonte de luz, contudo nessa demonstrao so os quadrados que parecem se mover.
Isso sugere que a percepo humana prefere a informao da sombra em detrimento a outros
indicativos de movimento do objeto, ignorando inclusive a falta de alterao de tamanho do
mesmo (KERSTEN; MAMASSIAN; KNILL, 1994).
Tambm h evidncias de que as sombras so particularmente expressivas em indicar
profundidade em cenas dinmicas onde os objetos e suas sombras esto em movimento (MA-
MASSIAN; KNILL; KERSTEN, 1998). De fato, nos estudos realizados por Kersten, Mamassian
e Knill (1994), relacionando objetos em movimento e a percepo relativa profundidade,
demonstrou-se que uma simples mudana no movimento da sombra o suficiente para alterar
drasticamente a nossa percepo da trajetria do objeto como mostra a Figura 8. Observando
a Figura 8 vemos em (a) a bola posicionada prxima superfcie a frente da caixa, enquanto
que em (b) e (c) apesar da bola estar na mesma posio, devido sombra projetada, em (c)
percebemos a bola longe da superfcie na frente da caixa e em (b) vemos a bola no fundo da
caixa prxima a superfcie.
As sombras so utilizadas em aplicaes de computao grfica, por sua capacidade
em melhorar o realismo das imagens e por nos ajudar a perceber ambientes 3D em cenas 2D
(HASENFRATZ et al., 2003), entretanto, em viso computacional sombras so na maioria das
vezes descartadas (PRATI et al., 2003). A teoria de relaes qualitativas percebveis sobre sombra
(PQRS) foi criada com a proposta de utilizar as informaes de sombra em sistemas artificiais,
tal como robtica mvel (SANTOS; DEE; FENELON, 2008).
O PQRS uma teoria fundamentada no clculo sobre ocluso de regio e assume um
contexto onde os elementos so: o observador, o objeto, a fonte de luz, a sombra e a superfcie
onde a sombra projetada. A fonte de luz (nica e fixa acima do observador e do objeto) ser
representada pelo smbolo constante L. Em seguida Scr representa a superfcie onde a sombra
projetada. O observador ser representado com o smbolo . Os conjuntos de variveis so
representados como objetos fsicos: o1 , . . . , on ; instantes de tempo: t1 , . . . , tn ; regies espaciais:
Figura 8: Bola na caixa. Mesmo na mesma localizao da bola em (b) e (c) percebemos posicionamentos diferentes
devido sombra.
Fonte:Kersten, Mamassian e Knill (1994).
r1 , . . . , rn ; e sombras: s1 , . . . , sn . Assume-se que as variveis so universalmente quantificadas

a menos que informado explicitamente sobre o contrrio.
Formado por um subgrupo do ROC, a teoria das relaes qualitativas percebveis sobre
sombras (PQRS) um conjunto composto pelas relaes de um objeto o e sua sombra s
representadas graficamente na Figura 9. A seguir as interpretaes e definies das relaes
bsicas do PQRS, so exemplificadas com imagens capturadas em nosso laboratrio (Figura 10)
(a conexo com a base do objeto desconsiderada):
N onOccludesDC(o, s, ) N onOccludes(o, s, )
DC(image(o, ), image(s, )), (2.9)
do ponto de vista no existe ocluso entre o objeto o e a sombra s conforme representado na

Figura 10a, onde a sombra s no est oclusa e na imagem aparece desconectada do objeto o do
ponto de vista ;
N onOccludesEC(o, s, ) N onOccludes(o, s, )
EC(image(o, ), image(s, )), (2.10)
do ponto de vista existe ocluso parcial da sombra s pelo objeto o conforme representado na
Figura 10b, onde objeto o no oclui a sombra s porm suas bordas esto conectadas do ponto de
vista ;
P artiallyOccludesP O(o, s, ) P artiallyOccludes(o, s, )

P O(image(o, ), image(s, )), (2.11)
do ponto de vista existe ocluso parcial entre o objeto o e a sombra s conforme representado
na Figura 10c, onde o objeto o oclui a sombra s de modo que na imagem a sombra s aparece
Figura 9: Representao grfica das relaes bsicas do PQRS.
Fonte: adaptada pelo autor de Randell e Witkowski (2002).
parcialmente ao lado do objeto o do ponto de vista ;
P artiallyOccludesT P P (o, s, ) P artiallyOccludes(o, s, )

T P P (image(o, ), image(s, )), (2.12)
do ponto de vista existe ocluso parcial da sombra s pelo objeto o conforme representado na
Figura 10d, onde objeto o oclui parte da sombra s tangenciando uma das bordas da sombra s na
imagem do ponto de vista ;
T otallyOccludesT P P I(o, s, ) T otallyOccludes(o, s, )

T P P I(image(o, ), image(s, )), (2.13)
do ponto de vista existe ocluso total da sombra s pelo objeto o conforme representado na
Figura 10e, onde objeto o oclui totalmente a sombra s a qual parte tangencial do objeto o na
imagem do ponto de vista ;
T otallyOccludesEQ(o, s, ) T otallyOccludes(o, s, )
EQ(image(o, ), image(s, )), (2.14)
Figura 10f, onde objeto o oclui totalmente a sombra s a qual igual ao objeto o na imagem do
ponto de vista ;
T otallyOccludesN T P P I(o, s, ) T otallyOccludes(o, s, )

N T P P I(image(o, ), image(s, )), (2.15)
Figura 10g, onde objeto o oclui totalmente a sombra s a qual no tangencia o objeto o na imagem
do ponto de vista .
Alm das relaes formalizadas acima, a teoria PQRS adota a primitiva Shadow(s, o, Scr, L)
que representa a sombra s do objeto o, provocada pela fonte de luz L sobre a superfcie Scr.
Figura 10: Imagens capturadas pelo P eopleBotT M . Representando as relaes PQRS (a) NonOcclu-
desDC(o,s), (b) NonOccludesEC(o,s), (c) PartiallyOccludesPO(o,s), (d) PartiallyOccludesTPP(o,s), (e) TotallyOc-
cludesTPPI(o,s), (f) TotallyOccludesEQ(o,s) e (g) TotallyOccludesNTPPI(o,s).
(a) (b)
(c) (d)
(e) (f)
(g)
Fonte:(SANTOS; DEE; FENELON, 2008).

Pode-se declarar que a sombra s do objeto o a mesma regio da superfcie Scr que est
totalmente oclusa pelo objeto o do ponto de vista da fonte de luz L. O axioma que restringe a
relao Shadow/4 apresentado pela frmula (2.16) abaixo:
Shadow(s, o, Scr, L) o0 (o 6= o0 ) Occludes(o0 , o, L)

P O(region(s), region(Scr)) T otallyOccludes(o, s, L). (2.16)
O axioma (2.16) diz que a sombra s do objeto o a regio na superfcie Scr que est
totalmente oclusa por o do ponto de vista da fonte de luz L, caso no exista outro objeto o0
ocluindo o do ponto de vista da fonte de luz. A partir deste formalismo podem-se provar alguns
teoremas sobre fatos do senso comum, os quais podem ser encontrados em Santos, Dee e Fenelon
(2008), Fenelon et al. (2012).
At agora as descries das relaes de ocluso foram feitas do ponto de vista da fonte
de luz. Porm, tambm possvel raciocinar sobre sombras a partir do ponto de vista de um
observador. Com o PQRS podemos inferir informaes tais como percepo de profundidade e
a localizao relativa do observador, ambas descritas em (SANTOS; DEE; FENELON, 2008;
SANTOS; DEE; FENELON, 2009). Por ser relevante a esse trabalho a seguir descreveremos
somente a localizao relativa.
2.2.3.1 Localizao relativa
Quando o observador tem dentro do seu campo visual um objeto com sua sombra
correspondente, podemos por deduo determinar a posio do observador em relao ao objeto
e a fonte de luz, ou seja, sua localizao relativa. possvel definir relaes entre sombra e
objeto a partir do ponto de vista de um observador. Essas relaes dependem da posio em que
o observador se encontra, portanto esta informao pode ser utilizada em um mecanismo de
auto localizao do rob. A partir da descrio de ocluso da sombra, cinco regies podem ser
observadas e definidas pelas linhas de viso entre a fonte de luz L, o objeto o e sua sombra s,
como representado na Figura 11b.
Para definir formalmente esta localizao, assumimos a relao located(r, , o, s) que
representa um observador localizado na regio r em relao ao objeto o e a sombra s. As
relaes so definidas a partir da sombra projetada pela parte superior do objeto (Figura 11a).
O termo r(r 1, 2, 3, 4, 5) representa as regies mostradas na Figura 11b, ento para definir a
localizao em cada regio temos que (SANTOS; DEE; FENELON, 2009):
located(1, , o, s) Shadow(s, o, Scr, L)

N onOccludesDC(o, s, ) 6= o, (2.17)
Figura 11: (a) Um objeto com sua sombra conectada e projetada numa superfcie irregular, destaque para a parte
da sombra relativa a parte superior do objeto; (b) Regies distintas expressas pela observao do objeto e sua sombra,
definidas pelas linhas de viso.
(a) (b)
2
l
1
3
s 4
O
5
L
s O
Fonte:Santos, Dee e Fenelon (2008).
a frmula (2.17) define que um observador na regio r = 1 observa que: o no oclui e est
desconectado de s, e s no sombra de (Figura 12a);

N onOccludesEC(o, s, ) 6= o, (2.18)
a frmula (2.18) define que um observador na regio 2 observa que: o no oclui e est
externamente conectado de s, e s no sombra de (Figura 12b);

P artiallyOccludesP O(o, s, ) 6= o, (2.19)
a frmula (2.19) define que um observador na regio 3 observa que: o parcialmente oclui e
sobrepe s, e s no sombra de (Figura 12c);

T otallyOccludesT P P I(o, s, ) 6= o, (2.20)
a frmula (2.20) define que um observador na regio 4 observa que: o oclui totalmente s e este
parte tangencial de o, e s no sombra de (Figura 12d);

T otallyOccludesN T P P I(o, s, ) 6= o, (2.21)
a frmula (2.21) define um observador na regio 5 observa que: o oclui totalmente s e este
parte no tangencial de o, e s no sombra de (Figura 12e).
Esta formalizao das relaes entre objetos e suas sombras do ponto de vista de um
observador facilita caracterizar qualitativamente o espao em volta do objeto. Iremos analisar
cada regio com fotos capturadas pelo P eopleBotT M no laboratrio do centro universitrio da
FEI. As imagens mantm o foco no objeto e na sua sombra projetada na parede enquanto o ponto
de vista do observador ser deslocado da regio 1 at a regio 5 (Figura 12).
Na Figura 12a observada uma sombra completa no oclusa pelo objeto onde ambos
(sombra e objeto) esto desconectados (N onOccludesDC) caracterizando a regio 1. Quando o
observador se desloca em direo regio 2, a sombra parece se deslocar ao encontro de seu
objeto. No momento em que o deslocamento do observador provoca (na imagem) o encontro
das bordas do objeto e sua sombra, o observador se encontra na regio 2, quando nesta regio
o objeto no oclui a sombra mas ambos esto prximos, deste modo podemos consider-los
externamente conectados (N onOccludesEC) (Figura 12b).
Na Figura 12c o observador est posicionado na regio 3, pois a sombra est parcialmente
oclusa pelo objeto, e na imagem o objeto aparece sobrepondo a sombra parcialmente. A regio
4 tem sua superfcie definida pela linha tangencial fonte de luz e ao objeto, nela a sombra
est a ponto de desaparecer. Note pela Figura 12d que a sombra est oculta pelo objeto na
regio 4, a qual a fronteira onde a sombra ir desaparecer por completo se o agente estiver se
movimentando na direo da regio 5 (Figura 12e), ou reaparecer se estiver indo na direo
da regio 3 (T otallyOccludesT P P I) (Figura 12c). Na regio 5 estamos no mesmo campo de
viso da fonte de luz, nesta regio a sombra est projetada numa superfcie totalmente oclusa
pelo objeto e, portanto, no possvel v-la (T otallyOccludesN T P P I) (Figura 12e).
Toda a teoria do PQRS baseada no fato de que as sombras so corretamente relacionadas
aos objetos. Portanto relacionar uma sombra com o objeto que a provocou necessrio para a
aplicao correta da teoria, pois uma inferncia com a sombra de outro objeto conduz ao erro.
Uma soluo automtica (parcial) para este problema de correspondncia proposta a seguir.
2.2.3.2 Correspondncia entre objeto e sombra
Uma sombra pode estar ou no conectada ao objeto que a projetou. Neste trabalho
foram desconsiderados os casos em que um objeto suspenso no ar ter a sua sombra projetada
desconectada do mesmo. Para formalizao de situaes em um ambiente de laboratrio usamos
uma hiptese simplificadora de que em nossos experimentos o objeto est imvel sobre o cho. A
sombra sempre estar conectada ao objeto que a provocou. Desta maneira, nas imagens, as regies
que representam o objeto e sua sombra esto externamente conectadas. A correspondncia entre
o objeto e sua sombra foi formalizada com base no PQRS, porm, vamos ver antes algumas
restries para a formalizao.
A frmula 2.16 garante que somente existe sombra s se houver o objeto o, uma superfcie
Scr e uma fonte de luz L, alm desses elementos outras restries devem ser observadas, so
elas:
Figura 12: Como a sombra aparece quando somente o observador altera sua posio para: (a) regio 1, (b) regio
2, (c) regio 3, (d) regio 4 e (e) regio 5 representadas no mapa da Figura 11b
(a) (b)
(c) (d)
(e)
Fonte:autor.
a fonte de luz nica, e est em posio superior ao objeto e ao observador;
os objetos esto sobre uma superfcie fixa, e no flutuam;
o observador estar sempre em posio vertical (em p).
O objeto sempre est externamente conectado (EC) com sua sombra. , portanto,
conveniente representar o objeto em base e topo: Base(x, z, ) significa x base de z do ponto
de vista de e T op(y, z, ) significa y topo de z do ponto de vista de . Base/3 obedece
aos seguintes axiomas:
x Base(x, x, ), (2.22)
isto , um objeto completo x no base dele prprio do ponto de vista ;
x y Base(x, y, ) z(x 6= z) T P P (region(x), region(y))

T P P (region(z), region(y)) EC(region(x), region(z)) T op(z, y, ), (2.23)
isto , x e z so diferentes e ambos so tangenciais parte prpria de y, ambos estando desconec-

tados sendo x a base de y ento z ser o topo de y, esse axioma separa o objeto em duas sub
partes: base e topo do ponto de vista de ;
x y [Base(x, y, ) T op(x, y, )], (2.24)
isto , caso uma parte x seja a base de y est no poder ser o topo de y;
x y z [[Base(x, y, ) Base(y, z, )] Base(x, z, )], (2.25)
isto , sendo x base de y e sendo y base de z ento por transitividade x base de z;
x y Base(x, y, ) z[P (region(z), region(x)) Base(z, y, )]

u[P (region(u), region(x)) T op(u, y, )], (2.26)
isto , qualquer parte z de x ser uma base de y tambm e no existe nenhuma parte u de x que
ser o topo y;
x y z Base(x, y, ) T op(z, y, ) P (image(x, ), image(y, ))

P (image(z, ), image(y, )) EC(image(x), image(z)), (2.27)
isto , que a base x e topo z do objeto y aparecem na imagem como parte de y e externamente
conectados. Assim para definir que determinada sombra s corresponde ao objeto o utilizamos a
frmula 2.28:
Corresponde(s, o, Scr, L) N (L, o, s) b Base(b, o, ) (2.28)

N T P P (s, Scr) N T P P (b, Scr) EC(s, b).
A frmula (2.28) diz que s sombra do objeto o quando:

a sombra s est conectada externamente base b do objeto o;
e a fonte de luz L se encontra mais prxima de o do que de s;
e que tanto a base b quanto a sombra s estejam ambas sobre a mesma superfcie.
A proximidade da fonte de luz representada pela primitiva de proximidade N (L, o, s) a qual

lida como a fonte de luz L est mais prxima do objeto o do que da sombra s (SANTOS;
DEE; FENELON, 2009). Essa formalizao suficiente para fazer a correspondncia da sombra
com seu objeto nas situaes consideradas neste trabalho.
Na Figura 13 podem ser observadas as restries da frmula (2.28). Nesta figura pelo
menos parte da sombra e a base do objeto esto localizadas na mesma superfcie (o piso). Na
Figura 13a, cada objeto tem somente uma sombra externamente conectada sua base e esta
se encontra mais distante da fonte de luz. J na Figura 13b um dos objetos tem duas sombras
conectadas sua base, neste caso a proximidade N (L, o, s) servir para confirmar qual sombra
corresponde ao objeto. Na Figura 13c pode-se ver outro tipo ambiguidade, pois nela um dos
objetos tem trs sombras conectadas a ele, destas somente a sombra que ele provocou verdadeira
para a frmula (2.28). Alm disso, nesta imagem um dos objetos est ocluso por outro do ponto
de vista do observador, assim na segmentao aparecem como um objeto com duas sombras
conectadas, uma na base e outra no, a partir de situaes como esta se pode deduzir a ocluso,
como a ocorre na Figura 14.
A formalizao da correspondncia entre objeto e sombra serviu como base para criar
uma funo que determina o par sombra-objeto, que utilizamos no sistema de auto localizao
baseado na localizao qualitativa descrita na seo 2.2.3.1. A teoria do PQRS foi utilizada
anteriormente em um algoritmo de auto localizao aplicado em um rob mvel (SANTOS;
DEE; FENELON, 2008; SANTOS; DEE; FENELON, 2009), o qual neste trabalho foi estendido
com tcnicas probabilsticas. As teorias de raciocnio espacial qualitativo, alm dos clculos
topolgicos, lidam com direes. As relaes de direes descrevem onde uma entidade espacial
est posicionada relativa outra entidade. A seguir vamos descrever o clculo de direes
cardinais.
2.2.4 Clculo de direes cardinais

Cardinal direction calculus ou clculo de direes cardinais (CDC) (FRANK, 1996) um
formalismo para raciocnio sobre direes entre objetos espaciais. O clculo tem nove relaes
bsicas: norte (north (n)), leste (east (e)), oeste (west (w)), sul (south (s)), noroeste (northwest
(nw)), nordeste (northeast (ne)), sudeste (southeast (se)) , sudoeste (southwest (sw)) e igual
(equal (eq)) que corresponde a regio central neutra (Figura 15). Em Frank (1996), essas regies
so resultados da diviso do espao em duas abordagens diferentes, que pode ser em forma de
cone ou em quadrantes. Para os dois sistemas Frank (1996) fez uma tabela de composio, e ao
final concluiu que a forma de quadrante melhor que a forma de cone por ter um nmero maior
Figura 13: Imagens capturadas no laboratrio, onde podemos aplicar a frmula de correspondncia de sombra,
note somente a sombra do objeto est externamente conectada sua base e mais distante da fonte de luz.
(a) (b)
(c)
Fonte: autor.
Figura 14: Por causa das sombras podemos inferir que h outro objeto totalmente ocluso pelo balde.
Fonte: Santos, Dee e Fenelon (2008).

Figura 15: Representao da projeo em quadrante, sendo os elementos representados como ponto (direito) e
regio (esquerda).
Fonte: Ligozat (1998).
de dedues exatas. Na Figura 15 encontra-se uma representao da abordagem em quadrantes

para os objetos sendo representados como pontos ou como regies.
A principal tarefa do CDC refere-se a inferir a direo entre dois objetos A e C, a partir
do conhecimento da direo entre A e (outro objeto) B e entre B e C. Essa inferncia vem da
tabela de composio entre as nove relaes bsicas, onde o resultado pode ser um conjunto de
possibilidades exclusivamente disjuntas (LIGOZAT, 1998). O conceito de vizinhana tambm
aplicvel devido topologia das relaes definidas pela proximidade entre as regies formadas,
como por exemplo, a transio que pode ocorrer a partir da relao sudeste se o subconjunto
composto pelas relaes s (sul), e (leste), se (sudeste) e eq (igual) (LIGOZAT, 1998). As relaes
de direo foram utilizadas nas tarefas de domnio de trfego, e de auto localizao com mltiplos
objetos. No domnio de trfego (seo 3.2) foi utilizado principalmente o clculo de direo
cardinal. Para auto localizao do rob com mltiplos objetos a transio de relao teve um
papel relevante, e o clculo de distncia foi utilizado junto com clculo topolgico ROC para
formalizar a localizao (seo 4.2).
As teorias de raciocnio espacial qualitativo aqui descritas sero utilizadas para inferir
informaes a partir de imagens. Nosso objetivo criar um sistema que interprete imagens e
as informaes sejam utilizadas por um rob. Estando esse rob em ambiente real, o sistema
ter que lidar com incertezas, as quais so causadas ou pelo rudo dos sensores ou pela falta de
informao. Para lidar com incerteza optamos por agregar uma abordagem probabilstica.
2.3 Modelos Probabilsticos

Uma finalidade da probabilidade em robtica lidar com incerteza, estimando valores
quantitativos do estado a partir de dados do sensor que no so diretamente observveis, mas
que podem ser inferidos. Dados dos sensores, controle e o estado do rob e de seu ambiente
so quantidades modeladas como variveis aleatrias. Uma varivel aleatria Y pode carregar
2.3. Modelos Probabilsticos 59
informao sobre outra varivel aleatria X, atravs de probabilidades condicionais (eq. (2.29)):
P (x|y) = P (X = x|Y = y). (2.29)
A regra de Bayes relaciona uma probabilidade condicional sua inversa de modo que:
P (y|x)P (x)
P (x|y) = . (2.30)
P (y)
A regra de Bayes tem um papel importante em inferncia probabilstica em geral. Pois conside-
rando que x uma quantidade que se quer inferir a partir de y, a probabilidade P (x) referente
a distribuio de probabilidade a priori, e y chamado de dado de informao (como dados
dos sensores). A probabilidade P (x|y) a distribuio de probabilidade posterior sobre X. A
regra de Bayes oferece um modo conveniente para calcular a probabilidade posterior P (x|y)
utilizando a verossimilhana P (y|x) e a probabilidade a priori P (x). Ou seja, para inferir x a
partir do dado y do sensor, a regra de Bayes permite especificar qual a probabilidade dos dados y
assumindo que x ocorra. Em robtica, a probabilidade P (y|x) frequentemente criada como um
modelo que descreve com algum nvel de abstrao como um determinado estado da varivel X
causa o valor de sensor Y (THRUN et al., 2005).
Tambm importante notar que o denominador na regra de Bayes no depende de x,
assim o fator P (y)1 uma constante para qualquer valor de x na probabilidade posterior P (x|y).
Por isso a constante pode ser escrita como um fator de normalizao, que em geral denominado
como :
P (x|y) = P (y|x)P (x). (2.31)
Neste trabalho usaremos o smbolo para indicar que o resultado foi normalizado para 1.
Podemos condicionar a regra de Bayes com uma varivel aleatria arbitraria Z = z,
como na equao (2.32):
P (y|x, z)P (x|z)
P (x|y, z) = . (2.32)
P (y|z)
Tambm podemos definir independncia condicional atravs da igualdade.
P (x, y|z) = P (x|z)P (y|z). (2.33)
Neste trabalho, utilizamos dois modelos: filtros Bayesianos e redes Bayesianas relacionais. A
seguir comearemos descrevendo brevemente o filtro Bayesiano.
2.3.1 Filtros Bayesianos

Filtros Bayesianos so algoritmos que calculam a distribuio de probabilidades sobre
crenas (bel) a partir dos dados medidos e do controle. Utiliza Xt para representar o estado atual,
o qual ser assumido como no observado, ou seja, o qual no se pode observar diretamente
por nenhum sensor. Enquanto Zt representa o conjunto de evidncias medidas que podem ser
observadas. A observao no instante t Zt = zt para um conjunto de valores de zt (STUART;

PETER, 2010). Com um conjunto de variveis de estado e evidncia para um dado problema, o
prximo passo especificar como o mundo evolui (modelo de transio) e como as variveis de
evidncia adquirem seus valores (modelo do sensor).
O modelo de transio determina a distribuio de probabilidade sobre os valores atuais
das variveis de estado, dados os seus valores prvios, o qual representado por P (xt |x0:t1 ).
O conjunto x0:t1 no tem limites de tamanho com o crescimento de t, mas considerando a
suposio de Markov - o estado atual depende somente de um nmero fixo e finito de estados
anteriores. Ou seja, um estado tem informao suficiente para fazer com que o futuro seja
condicionalmente independente do passado, e ento temos que o modelo de transio uma
distribuio condicional (eq. (2.34)):
P (xt |x0:t1 ) = P (xt |xt1 ). (2.34)
Em um modelo de transio as mudanas so governadas por regras que no mudam com

o tempo, e assim so caracterizadas como uma tabela de probabilidades condicionais (STUART;
PETER, 2010). Em nosso trabalho, os valores da tabela de transio se baseiam no conceito de
transio das relaes espaciais (seo 2.2.1). Em robtica quando o controle ut tem influncia
no modelo de transio do estado, a distribuio condicional dada por:
P (xt |xt1 , ut ). (2.35)
Para o modelo de sensor, as variveis de medidas zt podem depender tanto das variveis
de evidncias anteriores z0:t1 quanto da varivel do estado atual xt , mas qualquer estado atual
deve ser o suficiente para gerar o valor atual do sensor. Deste modo, aplicando a suposio de
Markov temos a equao (2.36):
P (zt |xt , z0:t1 ) = P (zt |xt ), (2.36)
assim, P (zt |xt ) o modelo de sensor. Em nosso trabalho as evidncias so as relaes espaciais
qualitativas percebidas a partir das imagens, por isso nosso modelo de sensor chamado de
modelo de imagem.
Um filtro Bayesiano tem duas etapas: a previso (bel(xt ) ) e a atualizao das medidas
(bel(xt )) (THRUN et al., 2005). Na etapa de previso a crena sobre o estado atual de um rob
condicionado ao controle u0:t e todas as evidncias anteriores z0:t1 sem a evidncia medida zt
(eq. (2.37)):
bel(xt ) = P (xt |z0:t1 , u0:t ). (2.37)
Note que na previso de medidas a medida do estado atual no foi considerada, ao incluir a
medida do estado atual temos a segunda etapa que a atualizao das medidas (bel(xt )) onde
2.3. Modelos Probabilsticos 61
o estado atual previsto ponderado pela probabilidade de uma atuao de controle ut e uma
medida zt realizada neste estado xt (eq. (2.38)):
bel(xt ) = P (xt |z0:t , u0:t ). (2.38)
O filtro Bayesiano recursivo, e calcula a crena do estado xt baseado na crena do estado

anterior xt1 e do controle ut (quando existente). Na etapa de previso a distribuio de crena
bel(xt ) (previso) do rob para o estado xt obtido pela soma do produto de duas distribuies:
o modelo de transio P (xt |xt1 , ut ) e a distribuio de crena bel(xt1 ) do estado anterior,
deste modo temos que:
bel(xt ) = P (xt |xt1 , ut )bel(xt1 )

X
xt1
= P (xt |xt1 , ut )P (xt1 |z0:t1 , u0:t1 ).

X
(2.39)
xt1
Na etapa de atualizao das medidas o filtro Bayesiano multiplica a distribuio de

crena prevista bel(xt ) pelo modelo de sensor para a evidncia zt observada. Isto realizado para
cada hipottico estado posterior xt . O valor encontrado ainda no um valor de probabilidade,
o qual deve ser normalizado por uma constante de normalizao . Isso resulta na distribuio
de crena final do estado bel(xt ) no instante t (form. (2.40)). Ao iniciar um algoritmo de filtro
Bayesiano a distribuio de crena bel(x0 ) para o instante t0 em geral recebe valores uniformes,
caso no exista informao sobre valores da distribuio de crena inicial.
P (xt |z0:t , u0:t ) = P (zt |xt ) P (xt |xt1 , ut )P (xt1 |z0:t1 , u0:t1 )
X
xt1
bel(xt ) = P (zt |xt )bel(xt ). (2.40)
Neste trabalho o filtro Bayesiano foi utilizado na tarefa de auto localizao qualitativa do
rob. As evidncias medidas so as relaes espaciais qualitativas percebidas atravs de imagens,
e o estado representa a regio onde o rob est localizado, e no se utilizou a varivel de controle
do rob. A prxima seo tratar das redes Bayesianas relacionais.
2.3.2 Redes Bayesianas relacionais

Redes Bayesianas so estruturas de grafos direcionados acclicos no qual os ns re-
presentam variveis aleatrias Xi e os arcos representam a dependncia entre as variveis
conectadas (PEARL, 1988). Aciclicidade uma caracterstica da rede Bayesiana. Outra caracte-
rstica das redes Bayesianas que cada n X tem uma distribuio de probabilidade condicional
(DPC) dpc(X) associada a ele. Uma DPC definida pelos pais do n X (P a(X)), deste modo
dpc(X) = P (X|P a(X)). Para construir uma rede Bayesiana, a condio de Markov suposta.
A condio de Markov diz que um n condicionalmente independente de todos os
outros ns na rede, dados seus pais, filhos e pais dos filhos (STUART; PETER, 2010). Com uma
rede Bayesiana, pode-se raciocinar sobre o domnio, inferindo informaes quando observado
o valor de alguma varivel. O processo de inferncia calcula a distribuio de probabilidade
posterior, para um conjunto de ns de consulta, dado os valores para alguns ns de evidncia
(KORB; NICHOLSON, 2003).
Uma rede Bayesiana relacional para um vocabulrio S dada por uma rede Bayesiana
que contm um n para toda relao r S. Os ns para relaes n-aria r S esto associados
com uma frmula de probabilidade Fr (x1 , . . . , xn ) sobre todos os smbolos dos pais de r (P a(r))
(JAEGER, 1997). A frmula de probabilidade indica como calcular a probabilidade de r(v) para
qualquer elemento v no domnio D. Quando uma inferncia requerida para alguma relao r(v),
ou seja, uma requisio para a probabilidade de r(v) condicionada por algum evento observado,
uma rede Bayesiana proposicional gerada; cada n desta rede representa a instanciao de uma
relao (COZMAN et al., 2004). O mtodo de redes Bayesianas relacionais foi desenvolvido por
Jaeger (1994b) e est incluso no pacote de domnio pblico do sistema Primula 6 (JAEGER et
al., 2006). Redes Bayesianas relacionais fazem parte do mecanismo de inferncia da lgica de
descrio probabilstica Credal ALC descrita a seguir.
2.4 Lgica de Descrio Probabilstica Credal ALC

A lgica credal ALC (CRALC) (COZMAN; POLASTRO, 2008) uma extenso pro-
babilstica da lgica de descrio ALC (SCHMIDT-SCHAUSS; SMOLKA, 1991). CRALC
integra a eficincia no tratamento de incertezas das redes Bayesianas, com a representao
relacional da lgica de descrio (COZMAN; POLASTRO, 2008). Nessa seo iremos falar
sobre o CRALC, mas antes vamos comear por um breve relato da lgica de descrio e algumas
extenses probabilsticas.
2.4.1 Lgica de descrio

Lgicas de descrio compartilham algumas caractersticas, sendo baseadas em conceitos,
como Planta e Animal; em papis, como paiDe e amigoDe; em indivduos, como Manuel e Maria.
Conceitos e papis podem ser entendidos como relaes unrias e binrias respectivamente.
Interseco, unio e complementao de conceitos so usualmente permitidas, bem como formas
restritas de quantificao com uso de papis. A inferncia bsica em lgicas de descrio : ser
o conceito A um conjunto vazio de indivduos, ou haver um indivduo em A? Uma detalhada
discusso de aplicaes de lgicas de descrio, bem como de seus aspectos tericos, pode ser
encontrada no Description Logic Handbook, (BAADER et al., 2003).
Lgicas de descrio no representam incertezas, sejam essas incertezas decorrentes
de ambiguidade, de falta de conhecimento, falta de preciso, ou de variaes estatsticas. Por
isso, um significativo nmero de propostas pode ser encontrado na literatura, onde lgicas de
6
http://people.cs.aau.dk/~jaeger/Primula/
2.4. Lgica de Descrio Probabilstica Credal ALC 63
descrio so combinadas com raciocnio sobre incerteza. significativa a existncia de um

Workshop on Uncertain Reasoning for the Semantic Web, ligado Semantic Web Conference.
Lgicas de descrio com representao de incertezas so por vezes baseadas em lgica
difusa (STRACCIA, 2005), por vezes baseadas na teoria de Dempster-Shafer (NIKOLOV et
al., 2007), e por vezes baseadas na teoria de probabilidades. Alm da literatura em lgicas de
descrio probabilsticas propriamente ditas, existem muitos trabalhos recentes sobre bases de
dados dedutivas (LAKSHMANAN; SADRI, 1994; LAKSHMANAN; SHIRI, 2001; PARSONS,
1996) e ontologias com suporte para probabilidades (FUKUSHIGE, 2004; HOLI; HYVNEN,
2005; HUNG; GETOOR; SUBRAHMANIAN, 2007; MITRA; NOY; JAISWAL, 2005; POOL;
AIKIN, 2004; UDREA; SUBRAHMANIAN; MAJKIC, 2006; YANG; CALMET, 2005).
Heinsohn (1994), Jaeger (1994a), Jaeger (1994b) e Sebastiani (1994b) propuseram
incluses probabilsticas em diferentes lgicas. As lgicas probabilsticas propostas por estes
autores consideravam que probabilidades so expressas sobre o domnio, ou seja, a lgebra que
recebe a medida de probabilidades formada por subconjuntos do domnio.
Drig e Studer (2005) adotaram a lgica ALC sem incluses probabilsticas, porm
considerando probabilidades independentes sobre indivduos. Lukasiewicz (2008) prope outra
estratgia, adotar uma relao de consequncia no-monotnica (GIUGNO; LUKASIEWICZ,
2002; LUKASIEWICZ, 2008) e permitindo com isso tanto incluses probabilsticas quanto
probabilidades sobre asseres. As propostas de Lukasiewicz (2008) so as lgicas de des-
crio probabilsticas mais expressivas na literatura, tendo como desvantagem sua semntica
extremamente particular.
2.4.2 Lgica de descrio probabilstica
As lgicas de descrio probabilsticas descritas acima compartilham o uso de proba-

bilidade sobre o domnio. Nenhuma das lgicas garante que um nico nmero real pode ser
atribudo a uma probabilidade P (C(a)|D(b)), onde C e D so conceitos e a e b so indivduos.
Esse tipo de situao muito comum em lgica probabilstica (HALPERN, 2003; HANSEN;
JAUMARD, 1996). A manipulao de conjuntos de probabilidades motivada pelo interesse
em realismo, flexibilidade e generalidade matemtica, e tambm pela dificuldade em garantir
unicidade quando probabilidades podem ser livremente associadas s frmulas.
Outra caracterstica das lgicas de descrio j mencionadas que nenhuma pode ex-
pressar julgamentos de independncia estocstica. Isso se deve, fundamentalmente, dificuldade
computacional de manipular simultaneamente conjuntos de probabilidades e restries no linea-
res representadas por julgamentos de independncia. Nas ltimas dcadas uma srie de lgicas
probabilsticas foram propostas com uma abordagem diferente: relaes de independncia so
usadas para reduzir a complexidade computacional, ao serem usadas para garantir unicidade de
probabilidades e para estruturar frmulas (FRIEDMAN; KOLLER; PFEFFER, 1999; FUHR,
1995; KOLLER; PFEFFER, 1998; JAEGER, 1997; POOLE, 1993; NGO; HADDAWY, 1997;
WELLMAN; BREESE; GOLDMAN, 1992).
Em particular, tem havido esforo significativo para combinar construes lgicas com
redes Bayesianas ou campos de Markov (GETOOR; TASKAR, 2007; MILCH; RUSSELL, 2007).
Essa abordagem pode tambm ser encontrada em vrias lgicas de descrio probabilsticas.
A lgica P-CLASSIC usa uma coleo de redes Bayesianas como semntica para qualquer
conjunto de frmulas (KOLLER; PFEFFER, 1997). Novamente, probabilidades so impostas
sobre o domnio e asseres no podem ser associadas a probabilidades. O mesmo ocorre com a
Tiny Description Logic de Yelland (1999), com a linguagem BayesOWL de Ding e Peng (2004),
Ding, Peng e Pan (2006), e com a lgica proposta por Staker (2002).
Uma abordagem diferente usada por Laskey e Costa (2012): sua proposta usar
fragmentos de redes Bayesianas para representar certos blocos fundamentais em lgica de
primeira-ordem, e combinar esses blocos conforme a terminologia de interesse. Essa abordagem
foi bastante geral, com incluses e asseres probabilsticas no entanto a dificuldade que um
algoritmo de inferncia no foi derivado. Uma abordagem similar foi adotada por Nottelmann e
Fuhr (2004), Nottelmann e Fuhr (2006), os quais partem de uma verso probabilstica de Prolog
e a especializam para uma lgica de descrio restrita.
As lgicas de Laskey e Costa (2012), Nottelmann e Fuhr (2004), Nottelmann e Fuhr
(2006), so relevantes por usarem, diferentes das demais, uma semntica baseada em proba-
bilidades sobre interpretaes. Isso significa que, em lugar de impor probabilidades sobre o
domnio, a lgica impe probabilidades sobre as possveis interpretaes I. Uma semntica
baseada em probabilidades sobre interpretaes pode facilmente lidar com probabilidades como
P (C(a)|D(b)); para calcular P (C(a)|D(b)), devemos calcular a probabilidade de encontrar
C(a) e D(b) entre todas as interpretaes para as quais vale D(b).
Uma semntica deve ser precisa para evitar o quanto possvel problemas de ambiguidade
na base de conhecimento (HUMMEL, 2009). Uma semntica baseada em interpretaes pode
interpretar uma incluso probabilstica (form. (2.41)), de pelo menos duas maneiras. Primeiro,
como uma afirmao probabilstica sobre cada indivduo (form. (2.42)). Segundo, como uma
afirmao sobre validade de sentenas (form.(2.43)):
P (C|D) [, ]; (2.41)
x : P (C(x)|D(x)) [, ]; (2.42)
P (x : C(x)|y : D(y)) [, ]. (2.43)

A segunda interpretao (form.(2.43)) coerente com uma variedade grande de lgicas probabi-
lsticas que empregam probabilidades sobre sentenas (na literatura em inteligncia artificial,
iniciadas por Nilsson (1986)).
A lgica de descrio ALC uma das mais utilizadas (SCHMIDT-SCHAUSS; SMOLKA,

1991). Nela um conceito pode ser definido recursivamente atravs de conjuno (C u D),
disjuno (C t D) e negao (C) de outros conceitos, bem como restrio existencial (r.C)
e restrio de valor (r.C) usando papis e conceitos. Uma incluso, C v D, indica que o
conceito D contm o conceito C. Uma definio, C D, indica que os conceitos C e D so
equivalentes. Um conjunto de incluses e definies uma terminologia; comumente se assume
que uma terminologia acclica (um conceito no pode se referir a ele mesmo atravs de uma
sequncia de incluses e definies). A semntica dada por um conjunto D chamado domnio e
um mapa I que associa cada indivduo a um elemento de D, cada conceito a um subconjunto de
D, e cada papel a uma relao binria em D D de forma que:
I(C u D) = I(C) I(D),
I(C t D) = I(C) I(D),
I(C) = D\I(C),
I(r.C) = {x D|y : (x, y) I(r) y I(C)},
I(r.C) = {x D|y : (x, y) I(r) y I(C)}.
Assim, uma incluso C v D satisfeita se e somente se I(C) I(D), e uma definio

C D satisfeita se e somente se I(C) = I(D). Por exemplo, C v ( temParente.Mulher) u
(compraDe.(Peixe t Fruta)) indica que C contm indivduos que tem um parente mulher e que
compram frutas ou peixes (ou ambos).
Nos sistemas baseados em lgica de descrio, a base de conhecimento formada por
dois elementos, a T Box e a ABox. A T Box introduz a terminologia, ou seja, o vocabulrio
aplicado a um domnio. Vocabulrios so os conceitos, indivduos e papis. A ABox contm
os dados que sero inseridos sobre indivduos em termos de conceitos e papis. As declaraes
na T Box e ABox podem ser identificadas por frmulas em lgica de primeira ordem. Alm
de armazenar terminologias e inseres, a lgica de descrio tambm raciocina sobre eles
(BAADER; NUTT, 2002).
2.4.3 Credal ALC - CRALC

O vocabulrio bsico do CRALC, assim como do ALC, contm indivduos, conceitos
(conjunto de indivduos) e papis (relaes binrias entre indivduos), conforme descrito na
Seo 2.4.1. Na verso probabilstica do ALC (CRALC), do lado esquerdo das incluses ou
definies aparecem somente os conceitos. Dado um nome de conceito C, um conceito D e um
nome de papel r, as seguintes asseres probabilsticas so possveis:
P (C) [, ], (2.44)
P (C|D) [, ], (2.45)
P (r) [, ]. (2.46)
Escrevemos P (C|D) = quando = , P (C|D) quando < = 1, e assim

por diante. Para garantir a aciclicidade, no permitido a nenhum conceito utilizar a si mesmo em
incluses ou definies determinsticas (ou probabilsticas). A frmula (2.44) pode ser descrita
assim: para qualquer x pertencente D, a probabilidade que x pertena interpretao de C est
no conjunto [, ] (form. (2.47)):

x D : P I : x I(C) [, ]. (2.47)
Informalmente, podemos representar a semntica como x D : P (C(x)) [, ]. A

semntica das frmulas (2.45) e (2.46) dado por (form. (2.48) e form. (2.49) respectivamente):
x D : P (C(x)|D(x)) [, ], (2.48)
(x, y) D D : P (r(x, y)) [, ]. (2.49)
Dado um domnio finito, um conjunto de sentenas em CRALC especifica probabilidades

sobre todos os conceitos e papis instanciados. Em geral, um conjunto de probabilidades
determinado pelo conjunto de sentenas, por exemplo, se for especificado o intervalo de valor de
probabilidade de C como P (C) [0, 2; 0, 3], quer dizer que todos os valores dentro do intervalo
so permitidos. Poucas suposies garantem que uma nica distribuio de probabilidade seja
especificada para um conjunto de sentenas: nome-nico, probabilidade-pontual na avaliao,
rigidez dos nomes (COZMAN; POLASTRO, 2008). Com essa suposio um domnio finito e um
conjunto de sentenas especificam uma nica rede Bayesiana sobre todos os conceitos e papis
instanciados. E para verificar a probabilidade de um papel ou conceito instanciado em particular,
pode-se gerar essa rede Bayesiana e ento us-la para inferncias probabilsticas (SANTOS et
al., 2010; FENELON et al., 2010).
Com CRALC pode-se especificar uma rede Bayesiana relacional com elementos de
lgica. O algoritmo do CRALC gera uma rede Bayesiana a partir da T Box onde os conceitos
so definidos em lgica de descrio ALC probabilstica. Para formar a rede os conceitos so
traduzidos como ns de tal modo que os conceitos esquerda so pais dos conceitos direita.
As asseres probabilsticas (form.(2.44), form.(2.45) e form.(2.46)) geram uma rede de forma
direta.
Uma definio A C traduzida para P (A|C) = 1 e P (A|C) = 0, ou seja, se A e C
so idnticos, logo dado C ento A (Figura 16(a)). A incluso A v C equivale a P (A|C) = 0,
se A est em C logo dado C ento A , nada diz diretamente sobre a probabilidade P (A|C),
Figura 16: Exemplo de representao CRALC em rede Bayesiana da incluso e da definio.
Fonte: Imagem modificada de Polastro (2012).
Figura 17: Exemplo de redes e tabelas de probabilidades condicionais geradas pelos construtores lgicos
Fonte: Polastro (2012).
um valor deve ser definido para est probabilidade P (A|C) = (Figura 16(b)). Seguindo esse
raciocnio na Figura 17 apresenta um exemplo das distribuies de probabilidades condicionais
(DPC, definido anteriormente) para P (E|A t B) = 0.8, F A t B e G v A t B onde as
interrogaes so probabilidades desconhecidas cujo valor deve ser definido.
As restries existenciais r.C so escritas na forma de ni=1 ri Ci . Ou seja, como
S
r(x, y).C(y) y r(x, y) u C(y) que pode ser escrita como uma disjuno de conjunes
((r(x, 0) u C(0)) t (r(x, 1) u C(1)) t . . . t (r(x, n) u C(n))). A representao Bayesiana
equivalente A(x) v r(x, y).C(y) a P (A(x)|r(x, y) u C(y)) = e P (A(x)|(r(x, y) u
C(y))) = 0 (Figura 18).
Para as restries universais r.C so escritas na forma ni=1 ri Ci . Ou seja, como
T
r(x, y).C(y) y r(x, y) C(y) y r(x, y) t C(y) que pode ser escrito como uma
conjuno de disjunes ((r(x, 0) t C(0)) u (r(x, 1) t C(1)) u . . . u (r(x, n) t C(n))). A
representao Bayesiana equivalente A(x) v r(x, y).C(y) P (A(x)|r(x, y) t C(y)) =
e P (A|(r(x, y) t C(y))) = 0 (Figura 19). Em ambos o valor da probabilidade que deve
ser definido. Esse o modo como o CRALC traduz as asseres lgicas de conceitos e papis, e
Figura 18: Exemplo de representao CRALC em rede Bayesiana da restrio de existencial.
Figura 19: Exemplo de representao CRALC em rede Bayesiana da restrio universal.
foi utilizado como base para a construo manual de uma rede Bayesiana relacional com papis
de relaes de direes cardinais neste trabalho (seo 3.3.2).
Como exemplo considerando uma terminologia com conceitos A, B, C e D. Supondo
que:
P (A) = 1 ,
B v A,
P (D|r.A) = 2 ,
C v B t r.D.
Na figura 20 os grafos so exemplos dessa terminologia em rede Bayesiana e com a sua

configurao para um domnio com dois indivduos.
Ao escrever o domnio em CRALC algumas restries devem ser observadas. Aciclici-
dade uma restrio para as lgicas probabilsticas que utilizem rede Bayesiana. Em CRALC os
conceitos primitivos so definidos com uma probabilidade a priori. Caso a probabilidade a priori
seja desconhecida, adota-se uma probabilidade neutra de 50%. Do mesmo modo so definidos
2.5. Localizao Robtica 69
Figura 20: Exemplo grfico de uma rede gerada a partir de uma terminologia , e sua caracterstica para um
domnio com dois indivduos [a, b] .
Fonte: Cozman e Polastro (2008).
os papis (relao entre dois indivduos). A partir das definies dos conceitos primitivos e
dos papis, novos conceitos podem ser criados. Ou seja, com esses conceitos uma hierarquia
de objetos pode ser formada. Um domnio pode ser definido a partir dos conceitos anteriores
e das restries. Em Polastro et al. (2010) uma ontologia definindo domnios de ambientes
foi desenvolvida com CRALC. Uma formalizao similar foi utilizada no reconhecimento de
objetos baseado em contexto (FENELON-PEREIRA; SANTOS; COZMAN, 2012).
2.5 Localizao Robtica

Estamos presenciando um movimento do emprego da tecnologia robtica das fbricas
para aplicaes em ambientes domsticos, escritrios e lugares pblicos. Nesses ambientes em
geral as tarefas a serem executadas exigem agentes robticos que se desloquem com segurana
(KRUSE et al., 2013). Assim capacidade de navegar pelo ambiente importante em robtica
mvel. Uma navegao autnoma necessita de habilidades tais como, localizao, planejamento,
construo ou interpretao de mapa e controle de movimento (SIEGWART; NOURBAKHSH,
2004; NEHMZOW, 2003). A localizao robtica consiste em estimar as coordenadas do rob
relativas ao ambiente externo. O rob tem as informaes do mapa e deve se localizar nele
utilizando os dados dos sensores. Neste trabalho o termo localizao qualitativa refere-se ao
mtodo de localizao no qual o mapa baseado em caractersticas qualitativas do domnio,
diferente do mapa mtrico.
Em uma das primeiras referncias sobre abordagem para localizao qualitativa, um
mapa topolgico foi construdo onde as bordas das regies eram definidas por um conjunto
de linhas conectando pares de pontos de referncias (LEVITT; LAWTON, 1990). Esta ideia
serviu de inspirao para vrias representaes espaciais. Dentre elas a representao espacial
chamada panorama, que restringe a localizao de um ponto relativamente a ordenao visual de
objetos observados em torno do rob (SCHLIEDER, 1996). A noo da navegao qualitativa
definida em Schlieder (1996), pelas alteraes na ordenao das informaes, que ocorre quando
o observador atravessa cada uma das linhas virtuais definidas pelos objetos de referncia. Essa
mesma ideia foi aplicada a um domnio da RoboCup e est relatada em (WAGNER; VISSER;
HERZOG, 2004).
Para a construo de mapas qualitativos Santos, Dee e Fenelon (2008) apresentou a teoria
PQRS em que o mapa qualitativo divide o espao em cinco regies baseado em uma formalizao
lgica de ocluso e observao de sombras, Fogliaroni et al. (2009) props um modelo de
visibilidade e ocluso de objetos para gerar as regies em espao navegvel. McClelland,
Campbell e Estlin (2013) introduziu um mtodo para a construo de mapa utilizando as posies
relativas dos pontos de referncia. Estes mtodos so geralmente baseados em algum tipo de
conceptualizao humana do espao, alguns deles fundamentados em descobertas recentes em
psicologia cognitiva (WOLTER; FREKSA; LATECKI, 2008). No entanto, eles so incapazes
de lidar com o rudo do sensor, o que limita a sua aplicabilidade a domnios bem controlados e
deterministas. Um panorama mais completo de representaes qualitativas para localizao do
rob apresentado em (WOLTER; FREKSA; LATECKI, 2008).
Os mtodos de localizao de maior sucesso em robtica so baseados em algoritmos
probabilsticos. Algoritmos de localizao probabilsticos so geralmente definidos como filtros
Bayesianos (THRUN et al., 2005). Como j vimos, na seo 2.3.1, o filtro Bayesiano um
algoritmo recursivo que consiste em duas partes: a previso e atualizao das medidas. Esta
definio bsica resume obras sobre localizao de Markov (FOX; BURGARD; THRUN, 1999)
e os procedimentos de localizao que utilizam filtros de Kalman (CHEN, 2012). Este ltimo
um caso especial da localizao de Markov, onde os modelos de sensores de movimento
so funes Gaussianas lineares. Mtodos conhecidos como algoritmos de Monte Carlo (DEL-
LAERT et al., 1999) estendem a localizao bsica de Markov por aplicao de um filtro de
partculas para representar a distribuio dos estados possveis . Dado o movimento do rob as
partculas so atualizadas de acordo com a previso do prximo estado e so redimensionadas de
acordo com a percepo do agente. Essas ideias tm uma alta aceitao no campo da robtica
(DELLAERT et al., 1999). Portanto, um levantamento completo das obras recentes relacionadas
com algoritmos de localizao probabilsticos uma tarefa difcil. Pesquisas das abordagens
iniciais para localizao robtica probabilstica podem ser encontrados em Thrun (2002), Thrun
et al. (2005).
2.6 Interpretao de Imagens

A primeira abordagem lgica para interpretao de imagens foi proposta por Reiter e
Mackworth (1989). Nesse arcabouo, trs conjuntos de axiomas so propostos, restringindo
assim o processo de interpretao de imagens. Dessa forma, interpretao de imagens torna-se
um procedimento de satisfao de restries. O sistema SIGMA (MATSUYAMA; HWANG,
1990) utiliza-se das ideias propostas por (REITER; MACKWORTH, 1989) e, adaptando-as a um
procedimento de raciocnio baseado em abduo de hipteses (POOLE; GOEBEL; ALELIUNAS,
1987) gera descries de imagens areas. Algumas das propriedades do formalismo subjacente a
2.6. Interpretao de Imagens 71
este sistema foram posteriormente exploradas por Schroeder e Neumann (1996), e revisitadas e
incorporadas em lgica descritiva por Neumann e Mller (2008) na dcada seguinte.
Em Shanahan (1996), um formalismo lgico proposto para definir rigorosamente a
transio das informaes provenientes dos sensores de um rob mvel para smbolos represen-
tando a existncia, localizao e a forma dos objetos observados. Essa proposta, porm, trata
da interpretao de cenas observadas de um ponto de vista global, em que os objetos sempre
permanecem visveis. Por outro lado, os trabalhos reportados em Santos e Shanahan (2002b),
Santos e Shanahan (2003), Santos (2007) consideram mudanas em um ambiente dinmico,
representado a partir de um ponto de vista egocntrico.
Partindo de princpios anlogos, Hazarika e Cohn (2002) descrevem um sistema para
a assimilao de cenas utilizando o conceito de histrias espaos-temporais (isto , regies
espaos-temporais representando o desenvolvimento temporal de relaes topolgicas entre
objetos fsicos). Esse modelo baseado em uma proposta anterior para a construo automtica
de modelos de eventos a partir de informaes visuais (FERNYHOUGH; COHN; HOGG,
2000). O trabalho proposto em Bennett, Cohn e Magee (2005) avalia mltiplas possibilidades de
histrias para explicar uma dada sequncia de imagens, e por um critrio de votao elege ao
final a histria mais consistente com a interpretao da sequncia. Em contraste utilizao de
histrias, em Santos et al. (2008) aplica-se um formalismo de aes, baseado em uma lgica de
processos (BONNER; KIFER, 1994) cuja semntica espelha o processo de transies de estados
ocorrido nas observaes dos objetos em cenas dinmicas.
Pesquisas na rea de avaliao de sequncias de imagens (image sequence evaluation
(NAGEL, 2000)) utilizam-se de algumas definies de raciocnio probabilstico, porm, por no
mencionarem formalismos lgicos, sofrem com a falta de definies rigorosas de semntica e
mtodos de inferncias. Neste trabalho um formalismo em raciocnio espacial qualitativo foi
utilizado para extrair das imagens capturadas por um rob informaes espaciais que possibilita
inferir a localizao do rob enquanto navega pelo ambiente. A sequncia de imagens foi anali-
sada com filtro Bayesiano utilizando informaes das relaes espaciais do domnio (captulo 4)
(FENELON et al., 2013).
Em um cenrio de trfego, por exemplo, o reconhecimento de faixa uma tarefa realizada
por imagens. As pesquisas em reconhecimento de faixa tm se concentrado tradicionalmente,
em estimar as propriedades geomtricas das faixas em frente do veculo utilizando equipamentos
de imagens (MCCALL; TRIVEDI, 2006). Em Hummel (2009) encontramos uma tentativa de
inferir propriedades funcionais das faixas, tal como a direo permitida da rua (por exemplo: ir
para cima ou para baixo, relativo a um sistema de coordenadas fixo), a permisso de mudar de
direo, ou interao com outros veculos. Avaliao destes dados funcionais para todas as faixas
so realizadas utilizando lgica de descrio e raciocnio espacial a partir dos dados coletados
de sensores on-board no veculo (HUMMEL, 2009). Neste trabalho, parte desse domnio foi
utilizado para formalizar com CRALC um algoritmo capaz de inferir em qual faixa o veculo
estava localizado e quais as mos de direo de todas as faixas (SANTOS et al., 2010; FENELON
et al., 2010). A seguir falaremos brevemente das tcnicas de viso computacional utilizadas neste
trabalho.
2.7 Viso Computacional

Uma imagem digital composta de um nmero finito de elementos conhecidos como
pixels, cada pixel tem uma localizao na imagem e um valor particular. Portanto, podemos
considerar a imagem digital como uma funo f (x, y) onde x e y so coordenadas espaciais
do pixel. A amplitude da funo f em pixel o valor discretizado (finito) que chamamos de
intensidade ou grau de cinza. Em geral as imagens em grau de cinza possuem somente um canal
de informao com seus valores variando de zero a 255, e as imagens coloridas consistem de
trs canais de informao.
A viso computacional pode ser definida por nveis de processo. Os processos de viso
do nvel baixo so caracterizados por melhorar a qualidade da imagem e envolvem operaes tais
como reduo de rudos, aumento do contraste, ou destaque de algum atributo. O processamento
de imagem de nvel mdio tem como caracterstica o fato das entradas geralmente serem imagens
e as sadas serem atributos extrados dessas imagens, tais como bordas, contornos e identificaes
de caractersticas individuais. As tarefas executadas neste nvel so segmentao, classificao
dos objetos individuais, entre outros. Finalmente, o processamento de nvel alto envolve o
reconhecimento de objetos coerentemente, como em anlise de imagem executada por funes
cognitivas (GONZALEZ, 2001).
2.7.1 Espao de cores em imagens digitais

As imagens digitais utilizam modelos de representao de cores conhecidos como espaos
de cores. Pelas caractersticas de hardware e dos tipos de dados analisados sero utilizados, neste
trabalho, os espaos de cores RGB (red,green,blue) e HSV (hue,saturation,value).
O modelo RGB tem trs canais de informao de cores: vermelho (255,0,0), verde
(0,255,0) e azul (0,0,255). baseado em um sistema de coordenadas cartesianas, e seu subespao
de cores representado por um cubo (conforme mostrado na Figura 21). Esse cubo um slido
composto de (28 )3 16.000.000 de cores. Podemos simplificar dizendo que RGB bom para
gerao de imagens coloridas, porm limitado para descrio de cores (GONZALEZ, 2001).
O modelo HSV ou HSI baseado em um sistema de coordenadas cilndricas, composto
pela cromaticidade representadas pelo matiz e a saturao, e pelos componentes de intensidade
ou brilho. As trs propriedades deste modelo so representadas por um cone conforme Figura 22.
O matiz (hue) H definido pelo o ngulo entre 0 e 2 relativo ao eixo do cone, matiz igual zero
representa o vermelho puro, 2/3 o verde puro e 4/3 o azul puro. A saturao S varia de 0 a 1
a partir do centro do cone e representa a tonalidade da cor, portanto alterao na saturao causa
2.7. Viso Computacional 73
Figura 21: Representao grfica do cubo de cores RGB, o cone da esquerda representa como uma cor(80,200,130)
est localizada neste sistema cartesiano.
Fonte: http://upload.wikimedia.org/wikipedia/commons/0/03/RGB_farbwuerfel.jpg ltimo acesso

em 20/02/2009.
Figura 22: Representao grfica do cone HSV.
Fonte: http://4.bp.blogspot.com/_7YvslLFdkCI/TO44RD7Q24I/AAAAAAAAAFs/MiAsTPjSNTA/
s1600/450px-HSV_Color_Cone.png ltimo acesso em 29/01/2014.
alterao de tonalidade de cor, como exemplo, a cor rosa um vermelho com uma saturao
baixa. A intensidade ou valor V varia no eixo vertical do cone e representa o brilho, variaes
em V so percebidas como sombreamento, quando o valor de V zero, a imagem aparece como
preto, independente da intensidade dos canais de cromaticidade (GONZALEZ, 2001; SHAPIRO;
STOCKMAN, 2001).
Uma consequncia destes canais de informao em HSV que eles so ideais para
o desenvolvimento de algoritmos, pois a separao em canais facilita a aplicao de filtros
para a separao de caractersticas (GONZALEZ, 2001; SHAPIRO; STOCKMAN, 2001). A
transformao de um modelo de cor RGB para HSV e vice-versa no linear, por brevidade
no detalharemos sua matemtica. Em nosso trabalho as imagens capturadas em RGB foram
convertidas para HSV, por terem caractersticas teis para segmentar imagem: com sombras
utilizamos informaes dos canais de intensidade V e saturao S; e com as caixas coloridas
usamos as informaes dos canais de matiz H e saturao S. A tcnica principal utilizada para
separar as informaes foi o filtro de limiar.
Figura 23: Grfico representando o filtro de limiar e o limiar T .
Fonte: Fonte:adaptada de Gonzalez (2001).
2.7.2 Filtro de limiar

Um dos mais simples mtodos para separar caractersticas o filtro de limiar. O filtro de
limiar, tambm conhecido como threshold, consiste em escolher alguns dos pixels como alvos
(foreground), que geralmente um objeto ou regio de interesse, os outros pixels no escolhidos
sero o fundo (background). Por exemplo, dada uma distribuio em escala de cinza em uma
imagem, e assumindo que um tom de cinza T seja escolhido como valor que separa os pixels em
grupos, ento, pode-se definir que todos os pixels maiores ou iguais a T sero o alvo enquanto
os menores sero o fundo. Pode-se classificar o filtro de limiar como: passa alta f (x, y) T ;
passa baixa f (x, y) T ; passa faixa Tmin f (x, y) Tmax ; e rejeita faixa f (x, y) < Tmin ou
f (x, y) > Tmax (Figura 23) (GONZALEZ, 2001; SHAPIRO; STOCKMAN, 2001).
Com esse filtro podemos obter uma imagem binria (preto e branco), ou uma imagem
truncada onde o limiar torna-se a intensidade mxima da imagem, ou o fundo igual zero
mantendo a intensidade do alvo. Esse um filtro til para segmentar imagem na qual os
objetos tm caractersticas bem definidas em um dos canais de informao (GONZALEZ, 2001;
SHAPIRO; STOCKMAN, 2001).
2.7.3 Filtros morfolgicos

Os filtros morfolgicos trabalham com a forma das imagens, seus operadores bsicos
so dilatao, eroso, fechamento e abertura. So utilizados para fechar lacunas, ou eliminar
pequenas reas. A dilatao funciona do seguinte modo: a partir de uma imagem binria B
e um elemento estruturante E, formam uma nova imagem dilatada, ao passar o elemento E
sobre a imagem B a nova imagem formada com os pontos da unio de B e E. Por outro lado,
na eroso um ponto somente ser mantido na nova imagem erodida se todos os pontos de E
forem tambm pontos de B. Uma explicao mais detalhada pode ser encontrada em Shapiro e
Stockman (2001).
Procurando facilitar o entendimento, tem-se uma representao da dilatao e da eroso
na Figura 24. Pode-se utilizar um filtro morfolgico de eroso para eliminar pequenas reas e logo
2.7. Viso Computacional 75
Figura 24: Representao grfica da dilatao e da eroso com uma matriz 3x3 com elemento estruturante E.
Fonte:http://www.cs.princeton.edu/~pshilane/class/mosaic/ ltimo acesso em 31/01/2014.
aps, um filtro morfolgico de dilatao para manter as caractersticas do objeto. A combinao

desses filtros nesta sequncia conhecida como operador morfolgico de abertura. O operador
morfolgico de fechamento tem sequncia inversa (dilata-erode) ao operador morfolgico de
abertura, utilizado para completar pequenos espaos vazios (SHAPIRO; STOCKMAN, 2001).
Neste trabalho aps aplicar o filtro de limiar, o filtro morfolgico de abertura foi empregado para
eliminar pequenas regies mantendo a forma das regies maiores.
2.7.4 Detectores de borda

Os detectores de bordas funcionam identificando as variaes acentuadas da intensi-
dade de pixels. Matematicamente, eles identificam transies bruscas da funo f (x, y), que
so medidas pela derivada primeira de f 0 (x, y) ou mesmo pela derivada segunda f 00 (x, y), o
processamento de f 0 (x, y) realizado utilizando a magnitude do gradiente. Para uma imagem
f (x, y), o gradiente de f nas coordenadas (x, y) definido por um vetor coluna bidimensional:

f
f = x
f
(2.50)
y
e a magnitude deste vetor dada por,
f 2 f 1
mag(f ) = [( ) + ( )2 ] 2 . (2.51)
x y
Os operadores para deteco de bordas que utilizam gradientes so Sobel, Prewitt, Laplace,
Canny. Mais detalhes sobre estes detectores de borda podem ser encontrados em (GONZALEZ,
2001; SHAPIRO; STOCKMAN, 2001).
Figura 25: Exemplo da aplicao do componente conectado, a partir da imagem original (esquerda) um filtro
limiar e morfolgico aplicado (meio) o resultado na imagem com grupos de mesmo valor (representado pela cor).
Fonte: autor.
2.7.5 Componentes conectados

A segmentao por componente conectado verifica todos os pixels de uma imagem,
comparando se os pixels vizinhos so semelhantes. A partir desta avaliao cria-se uma nova
imagem, onde cada grupo ter o mesmo valor. Um exemplo desta segmentao pode ser vista na
Figura 25. Da esquerda para direita, v-se a imagem original em RGB, o objeto extrado com
filtro de limiar e a imagem segmentada por componentes conectados.
Note que o filtro de componente conectado til para separar e distinguir objetos, assim
possvel extrair informaes como rea e quantidade de elementos. As informaes extradas a
partir deste filtro podem ser utilizadas em etapas de nvel alto, como classificao e deciso. Os
componentes conectados foram importantes em nosso trabalho, pois com eles determinam-se as
regies de interesse na imagem. Com os detectores de borda definem as bordas dessas regies, e
essas informaes sero utilizadas para extrair quais as relaes entre as regies na imagem. No
prximo captulo vamos falar sobre o trabalho desenvolvido no domnio de trfego, referente
primeira contribuio.
Parte I
Primeira Contribuio
79
3 RACIOCNIO ESPACIAL QUALITA-

TIVO COM LGICA DE DESCRIO
PROBABILSTICA
Este captulo apresenta uma formalizao de um domnio espacial na forma de raciocnio

espacial qualitativo codificado em uma lgica de descrio probabilstica, para responder per-
guntas sobre um domnio de trfego. A razo de utilizar lgica de descrio probabilstica para
este problema desenvolver um subconjunto tratvel do raciocnio espacial qualitativo capaz de
manipular incertezas de forma rigorosa, bem como permitir a representao de conhecimento de
alto nvel. Para o raciocnio espacial qualitativo utilizamos um subconjunto do clculo de direo
cardinal (FRANK, 1996; LIGOZAT, 1998) (seo 2.2.4) e a lgica de descrio probabilstica
CRALC (COZMAN; POLASTRO, 2008) (seo 2.4). Como domnio, consideramos um cenrio
onde um veculo experimental transita por uma via e est equipado com trs sensores: um mapa
digital, um GPS e uma cmera de vdeo.
A partir deste domnio, a tarefa do sistema consiste em responder duas questes: qual
faixa corresponde aquela em que o veculo est?; e qual mo de direo cada faixa permite?.
Essa tarefa foi proposta com o objetivo de investigar como utilizar o CRALC com raciocnio es-
pacial qualitativo e quais seriam suas limitaes. Uma formalizao do domnio foi desenvolvida
para responder essas questes e foi testado com os estados de informaes dos sensores, j que
para este domnio no tivemos acesso aos dados reais dos sensores. A seguir apresentaremos o
cenrio de trfego restrito que utilizamos, o qual foi inspirado no domnio de trfego de Hummel
(2006).
3.1 Descrio do Cenrio de Trfego

Nosso domnio consiste de um cenrio de trfego onde uma rua dividida em faixas.
Cada faixa da rua tem somente uma mo de direo: ou sobe, ou desce. Entre cada par de faixas
existe uma linha divisria, a qual ou uma linha tracejada, ou uma linha contnua (Figura 26a).
O cenrio tambm contm um veculo experimental equipado com trs sensores: um mapa
digital, um GPS e uma cmera de vdeo (Figura 26b). O formalismo deve estimar as propriedades
funcionais da rua onde o veculo est, utilizando os sensores do veculo para responder a seguintes
questes:
1. qual faixa corresponde aquela em que o veculo est? - A resposta um elemento do

conjunto: {1, . . . , n}, onde n o nmero de faixas da rua. Esta tarefa vem do fato que os
80 Captulo 3. RACIOCNIO ESPACIAL QUALITATIVO COM LGICA DE DESCRIO PROBABILSTICA
Figura 26: Representao grfica do cenrio de trfego (mo francesa). (a) Representao da rua, faixa, e linhas
divisrias. (b) Representao do veculo no cenrio.
(a) (b)
Fonte: Fenelon et al. (2010).
receptores do GPS so capazes de determinar a rua em que o veculo est, mas no em

qual faixa (HUMMEL, 2006).
2. qual mo de direo cada faixa permite? - A resposta se a mo de direo da faixa : ou

sobe, ou desce relativo ao sistema de coordenada da rua.
Os dados do sensor de vdeo tm maior grau de incerteza. Este sensor consegue obter
poucas informaes das faixas adjacentes quela em que o veculo est. Uma das razes para tal
fato porque o campo de viso que est frente do carro tem um ponto cego sobre grande parte
das faixas adjacentes. Alm disso, as linhas divisrias de faixa, as marcaes no cho (como
setas de direo) e sinais de trnsito podem no aparecer na imagem devido ocluso causada
por outros veculos. Contudo ocluso no ser um problema que iremos tratar neste domnio.
Algumas propriedades no so explicitamente dadas na forma de smbolos, mas precisam
vir do contexto de um motorista humano (tal como a regra de trnsito da mo-direita). Estas
observaes so refletidas pelas entradas dos sensores disponveis. Os sensores disponveis para
resolver a tarefa aqui proposta so:
Cmara de vdeo - um algoritmo de reconhecimento de marcas de diviso baseado em v-

deo reconhece a linha de diviso e a classifica como linha tracejada ou linha contnua.
Das informaes obtidas pelo sensor de vdeo, uma matriz de confuso com os valores
probabilsticos de reconhecimento e classificao do tipo de faixa est especificada na
Tabela 3.
3.1. Descrio do Cenrio de Trfego 81
Figura 27: (a) Cena Original. (b) Exemplo dos dados dos sensores para o cenrio da cena original.
(a) (b)
Fonte: Santos et al. (2010).
Tabela 3: Matriz de confuso do sensor de captura de imagem em que colunas representam o tipo de linha divisria
real enquanto que as linhas representam como a linha divisria foi classificada pelo sistema.
Vdeo: Linha divisria

Classificao
Contnua Tracejada
Contnua 0,80 0,07

Tracejada 0,20 0,93
Fonte: Santos et al. (2010), Fenelon et al. (2010).
GPS - este sensor informa a rua em que o veculo est, assim como define a direo em que ele
se desloca. As direes so discretizadas como going up ou going down relativo ao
sistema de coordenadas da rua (HUMMEL, 2009).
Mapa digital - este sensor informa quantas faixas a rua tem e se esta uma rua de mo nica
ou de mo dupla. A Tabela 4 representa a matriz de confuso com a taxa de acerto das
informaes desse sensor.
Os valores da Tabela 4 so baseados nos resultados do algoritmo comparados com

o evento real (ground truth) (HUMMEL, 2009), enquanto que os dados da Tabela 3 foram
estimados. A Figura 27a mostra uma imagem da rua do ponto de vista do carro, enquanto que a
Figura 27b tem uma representao dos dados dos sensores para o mesmo ponto de vista.
Neste domnio tratamos com as direes globais (enquanto que o domnio inspirado
em uma cena dinmica natural de trfego), assume-se que cada rua tem seu prprio sistema
de direo cardinal, no qual a direo Down-Up (Desce-Sobe) em vez de South-North
(Sul-Norte) vai da origem da via at seu fim, seguindo a linha central da rua. Em outras palavras,
Down-Up representa a direo entre dois objetos A e B na via e so definidos como uma
Tabela 4: Matriz de confuso dos valores de probabilidade de resposta do sensor mapa digital em que colunas
representam o tipo de rua enquanto que as linhas representam como a rua foi classificada pelo sistema.
Mapa digital:
Classificao da rodovia
Mo nica Duas mos
Mo nica 0,99 0,01

Duas mos 0,01 0,99
Figura 28: Um sistema cardeal para vias: A est ao sul de B e oeste de C.
projeo da linha de A para B, que no necessariamente a linha central da rua. A direo

East-West (Leste-Oeste), referida como right-left (direita-esquerda) definida como todos os
pontos da via que esto na linha ortogonal que tangencia a linha central naquele ponto. A Figura
28 mostra um exemplo de como so definidas estas direes.
Com o conhecimento das caractersticas da rua e das regras de trnsito possvel inferir
novas informaes, somando-se s informaes dos sensores. Na prxima seo apresentaremos
uma formalizao deste domnio em CRALC, a fim de estimar propriedades funcionais da rua
utilizando os sensores do veculo. A taxonomia dos conceitos e papis relevantes tarefa de
trafegar apresentada a seguir.
3.2 Definindo o Cenrio de Trfego em CRALC

Com o domnio definido em lgica de descrio probabilstica, a base de conhecimento
referente as caractersticas e regras do cenrio ser formalizada em uma T Box. O conceito
Lane (faixa) definido utilizando duas primitivas, Up (sobe) e Down (desce) (form. (3.1)). O
conceito Divider (linha divisria) definido como a unio de DashedDivider (linha tracejada)
3.2. Definindo o Cenrio de Trfego em CRALC 83
e SolidDivider (linha contnua) (form. (3.2)), e o conceito Vehicle (veculo) definido como
GoingUp (subindo a rua) ou GoingDown (descendo a rua) (form.(3.3)) :
Lane Up t Down (3.1)

Divider DashedDivider t SolidDivider (3.2)
Vehicle GoingUp t GoingDown (3.3)
Nas frmulas (3.4)(3.8) e (3.10) uma abreviao disjoint(t1 , t2 , . . . , tn ) foi utilizada

para representar o conjunto de declaraes sobre termos exclusivamente disjuntos, por exem-
plo, disjoint(ti , tj ) significa que ti contm indivduos que no so tj , assim ti v tj i, j
1, ..., n, i 6= j, onde o conceito ti inclui a negao do conceito tj e ambos so conceitos diferentes.
disjoint(Vehicle, Divider, Lane) (3.4)

disjoint(Up,Down) (3.5)
disjoint(DashedDivider, SolidDivider) (3.6)
disjoint(GoingUp, GoingDown) (3.7)
disjoint(OnOneWayRoad, OnTwoWayRoad) (3.8)
A taxonomia dos papis consiste das relaes do clculo de direes cardinais (CDC)
(seo 2.2.4). Definimos um CDC inspirado no formalismo proposto em Ligozat (1998), onde
objetos espaciais so pontos em um espao bidimensional e as direes cardinais entre dois
objetos A e B so definidas como duas projees de uma linha reta de A para B: uma no eixo
Sul-Norte (Down-Up) e outra no eixo Oeste-Leste (left-right).
Considerando que o nosso domnio no tem cruzamento, somente utilizamos trs das
nove relaes bsicas de direo cardinal: leste (east (e)), oeste (west (w)) e igual (equal
(eq)). Vale informar que a relao eq representa o fato de um veculo estar localizado em uma
determinada faixa. Deste modo o conceito cdc definido como a unio dos papis disjuntos
e, w, eq (frmulas (3.9) e (3.10)) abaixo:
cdc e t w t eq (3.9)
disjoint(e, w, eq) (3.10)
A seguir, utilizando os conceitos e papis acima descritos ser formulado um conjunto

de conceitos mais restritos construdos sobre a regulamentao de trnsito. Comearemos
formalizando a semntica de trfego para a mo de direo da faixa, conforme definido pelas
frmulas (3.11) e (3.12). Considerando que este domnio tem o sentido de circulao pela direita
(mo francesa), em uma via de mo dupla a faixa na extremidade direita da rua s permitido
aos veculos trafegarem subindo (GoingUp), enquanto que a faixa na extremidade esquerda da
rua permite somente o oposto disso (GoingDown). A frmula (3.11) define GoingUp quando a
leste do veculo existe uma linha divisria contnua SolidDivider e no existe nenhuma faixa
Lane ou a leste existe uma linha divisria tracejada DashedDivider e uma faixa Up. De modo
semelhante, a frmula (3.12) define que GoingDown est dentro do conjunto onde a oeste do
veculo existe uma linha divisria contnua SolidDivider e no existe nenhuma faixa Lane, ou a
oeste existe uma linha divisria tracejada DashedDivider e uma faixa Down.
GoingUp v e.(SolidDivider u Lane) t e.(DashedDivider u Up) (3.11)

GoingDown v w.(SolidDivider u Lane) t w.(DashedDivider u Down) (3.12)
As frmulas (3.13) e (3.14) referem-se s linhas divisrias, as quais se situam nas bordas
das faixas. Neste cenrio um DashedDivider uma linha tracejada que separa faixas com
mesma mo de direo, enquanto um SolidDivider uma linha contnua que separa faixas com
direes opostas ou indica a borda da pista.
DashedDivider v (e.Up u w.Up) t (e.Down u w.Down) (3.13)

SolidDividerv(e.Lane u w.Lane) t ( w.Lane u e.Lane) t
(3.14)
(e.Up u w.Down) t (e.Down u w.Up)
Na frmula (3.13) o conceito DashedDivider est no conjunto em que a leste e a oeste

da linha ou ambas as faixas so Up ou ambas so Down. Na frmula (3.14) SolidDivider pode
ocorrer quando ou no existe uma faixa a leste da linha e existe a oeste, ou no existe uma faixa
a oeste da linha e existe a leste, ou a leste a faixa Up e a oeste Down, ou a oeste a faixa Up
e a leste Down. Finalmente, a frmula (3.15) descreve uma via de mo nica, no qual todas as
faixas relacionadas com a rua ou so Up ou so Down, a frmula (3.16) define uma via de mo
dupla, onde existe pelo menos uma faixa Up e uma faixa Down relacionadas com a rua.
OnOneWayRoad v cdc.Up t cdc.Down (3.15)

OnTwoWayRoad v cdc.Up u cdc.Down (3.16)
Os sensores que equipam o veculo so conceitos que vamos adicionar a nossa T Box
como subclasses que define Sensor (form. (3.17)). A frmula (3.18) define o sensor de
classificao de linha divisria SensedDashedDivider pela classificao da faixa detectada
(SensedDashedDivider ou SensedSolidDivider).
Sensor SensedOnOneWayRoad t
SensedOnTwoWayRoad t SensedDivider (3.17)
SensedDivider SensedDashedDivider t SensedSolidDivider (3.18)
As probabilidades podem ser representadas como probabilidades condicionais, de modo

que a probabilidade de um evento real ocorrer vinculada leitura de dados do sensor. As
tabelas (Tabelas 3 e 4) so matriz de confuso com os valores das probabilidades da deteco de
um evento. Por exemplo, para a definio dos conceitos de linhas divisrias pode ser formulado
3.3. Estratgias para Soluo da Tarefa 85
como um conjunto de probabilidades condicionais, utilizando os valores da Tabela 3, como a

seguir (form.(3.19) - form.(3.22)):
P (DashedDivider|SensedDashedDivider) = 0, 93 (3.19)
P (SolidDivider|SensedDashedDivider) = 0, 07 (3.20)
P (DashedDivider|SensedSolidDivider) = 0, 20 (3.21)
P (SolidDivider|SensedSolidDivider) = 0, 80 (3.22)
As frmulas apresentadas at aqui formam a nossa base de conhecimento referente s

regras e caractersticas do domnio, ou seja, a T Box especificada. Enquanto que os dados dos
sensores GPS, mapa digital e cmera de vdeo formam a ABox conforme segue um exemplo:
GPS: o veculo apresentado como um indivduo v e o GPS informa que v est subindo a
rua (GoingUp), a qual deve ter pelo menos uma faixa com direo Up, assumindo que o
motorista sempre dirija na direo correta.
v : Vehicle
v : GoingUp
Mapa Digital: mostra que v est dirigindo em uma via de mo dupla ou de mo nica; e
informa o nmero de faixas (neste contexto sempre trs faixas). As faixas so apresentadas
como indivduos l1 , l2 , l3 , o menor nmero, por conveno, corresponde faixa mais a
leste.
v : SensedOnTwoWayRoad
Lane = {l1 , l2 , l3 }
(l1 , l2 ) : e
(l2 , l3 ) : e
Cmera de vdeo: uma linha divisria tracejada foi reconhecida e classificada pelo sensor
e est a leste de v:
d1 : SensedDashedDivider
(d1 , v) : e
No CRALC as informaes da ABox sero representadas como evidncias da rede

Bayesiana formada com os dados da T Box. Com o domnio formalizado, vamos descrever como
a tarefa foi resolvida.
Figura 29: Domnio de trfego e todas as situaes possveis para o veculo que esteja dentro das regras.
Fonte: adaptado de Santos et al. (2010) e Fenelon et al. (2010).

3.3 Estratgias para Soluo da Tarefa

Representando os estados deste domnio a Figura 29 exibe uma matriz de imagens onde
cada linha tem um tipo de rua e as colunas representam a posio do carro em uma das faixas.
Algumas consideraes sobre esse domnio:
existe um nico carro;
o sentido de circulao e sinais horizontais seguem as leis brasileiras de trnsito ;
o motorista no desrespeita as leis de trnsito, anda sempre dentro da faixa;
a rua tem um nmero fixo de trs faixas.
Procuramos formalizar o domnio observando tambm algumas restries impostas pelo

software que a partir da terminologia em CRALC gera automaticamente uma rede Bayesiana
para inferncia. Contudo, no foi possvel representar diretamente as frmulas (3.9) e (3.10),
pois apesar destas serem parte da definio bsica do CRALC, a hierarquia de papis no est no
escopo do ALC e, consequentemente, no est no CRALC. Por isso fizemos duas abordagens,
publicadas em Santos et al. (2010) e em Fenelon et al. (2010) para cumprir a tarefa de desenvolver
um mecanismo de inferncia, o qual dado a percepo dos sensores seja capaz de responder: em
qual faixa o carro est e qual a mo de direo de cada faixa.
3.3.1 Inferncia com uma rede Bayesiana

Para utilizar o mecanismo de inferncia do CRALC as informaes do clculo de direo
sobre o domnio ficaram implcitas nas definies de cada faixa e de suas possveis direes. Ou
seja, nenhuma assero de conceito que utilizaram papis faz parte desta T Box. Assim, a soluo
proposta para utilizar o CRALC foi deixar todos os papis implcitos, proposicionalizando a
ontologia e evitando as definies cclicas (SANTOS et al., 2010).
As relaes entre indivduos eq.Lane ("existe um veculo na faixa") foram includas
na base de conhecimento como novos conceitos, tais como Onl1, Onl2 e Onl3 (form.(3.23),
form.(3.24) e form.(3.25) respectivamente) que indica em qual faixa o veculo se encontra (On
faixa (li, i= {1, 2, 3})). Enquanto que para a direo de cada faixa foram utilizados os conceitos
Upli e Downli (para, i = {1, 2, 3}), indicando que uma faixa i tem mo de direo subindo ou
descendo respectivamente (form. (3.26) at form.(3.31)). Como hiptese simplificadora somente
uma linha divisria percebida pela cmera.
Onl1 (GoingDown u OnOneWayRoad u DashedDivider u Onl2) t

(GoingUp u SolidDivider). (3.23)
Tabela 5: Tabela com oito estados dos sensores indicando as dozes possibilidades de estado do veculo conforme
representado na Figura 29. Com as coordenadas mudando relativas ao sentido de deslocamento do carro.
OnOneWayRoad OnTwoWayRoad
SolidDivider DashedDivider SolidDivider DashedDivider
L1 0 1 0 0
L2 0 1 0 1
GoingDown
L3 1 0 2 0
L1 1 0 2 0
L2 0 1 0 1
GoingUp
L3 0 1 0 0
Fonte: autor.
Onl2 (OnOneWayRoad u DashedDivider) t

(OnTwoWayRoad u DashedDivider). (3.24)
Onl3 (GoingDown u SolidDivider) t

(GoingUp u OnOneWayRoad u DashedDivider u Onl2). (3.25)
Upl1 (GoingUp u OnOneWayRoad). (3.26)
Upl2 (GoingUp u OnOneWayRoad) t

(GoingUp u OnTwoWayRoad u Onl2). (3.27)
Upl3 (GoingUp u OnOneWayRoad) t OnTwoWayRoad. (3.28)
Downl1 (GoingDown u OnOneWayRoad). (3.29)
Downl2 (GoingDown u OnOneWayRoad) t

(GoingDown u OnTwoWayRoad u Onl2). (3.30)
Downl3 (GoingDown u OnOneWayRoad u Onl3) t OnTwoWayRoad. (3.31)
Nesta abordagem, o ponto de vista da cmera relativo ao carro, ou seja, sempre

identificada a faixa que est do lado do passageiro. Portanto, significa que pelas coordenadas
da rua a linha divisria que ser classifica est: a oeste do carro caso este se desloque para o
sul, e a leste do carro caso o sentido de deslocamento seja norte. Considerando os doze estados
representados na Figura 29, a Tabela 5 mostra para cada combinao de resultados dos sensores
quantas vezes o carro est na faixa. Essa tabela auxiliou na definio dos conceitos Onl1,
Onl2 e Onl3 (form.(3.23), form.(3.24) e form.(3.25) respectivamente), a partir da disjuno de
conjunes das respostas dos sensores.
Figura 30: Rede Bayesiana formada com conceitos e papis embutidos no banco de conhecimento. Todos os ns
em azul so evidncias observadas pelos sensores.
Fonte:Santos et al. (2010).
Quando um conceito definido por disjuno exclusiva, como na frmula (3.4), isso
poderia gerar um ciclo, que no permitido nas redes Bayesianas. Assim sendo, nesta abordagem
as disjunes exclusivas tal como disjoint(A, B, C) foram representadas utilizando declaraes
como A v C e B v A u C. Essa representao foi aplicada para as disjunes exclusivas
referentes: a frmula (3.7); a resposta do sensor de linhas divisrias, para garantir a disjuno
exclusiva da frmula (3.6); e para os conceitos Onli. Mais algumas adaptaes realizadas na
ontologia apresentada na seo 3.2 foram:
A disjuno exclusiva da frmula (3.8) representada pela probabilidade do

(SensedTwoWayRoad).
A frmula 3.1 que define Lane definida como frmula (3.32);
e a frmula 3.33 a que define Vehicle.
Lane GoingUp t GoingDown (3.32)

Vehicle OnOneWayRoad t OnTwoWayRoad (3.33)
Dado o formalismo apresentado na seo 3.2 e as consideraes acima, o sistema gerou

automaticamente a rede Bayesiana para um nico indivduo (Figura 30). Os ns referentes per-
cepo dos trs sensores (GoingUp, GoingDown, SensedTwoWayRoad, SensedDashedDivider
Tabela 6: Resposta da rede Bayesiana representada na Figura 30 para a primeira questo: qual faixa tem maior
probabilidade do carro estar localizado. As evidncias referentes aos dados dos trs sensores (A) esto expressas
nas trs primeiras colunas.
GPS Mapa Cmera rede Bayesiana (Figura 30)

GoinUp SensedOnTwoWayRoad SensedDashedDivider argmaxli P ((v : Onli))
0 0 0 l3
0 0 1 l1 t l2
0 1 0 l3
0 1 1 l2
1 0 0 l1
1 0 1 l2 t l3
1 1 0 l1
1 1 1 l2
e SensedSolidDivider) so ns que recebem sua informao de valor a partir da ABox. Por

exemplo, caso o sensor perceba que o carro est subindo a rua ento o n GoingUp ser uma
evidncia verdadeira, representado na rede Bayesiana da Figura 30 com a cor azul. Nesta confi-
gurao existem oito combinaes de evidncias para esses sensores. Com a rede da Figura 30
possvel responder as questes:
1. Em qual faixa (li) o veculo (v) tem a maior probabilidade de estar? Essa inferncia dada
por argmaxli P ((v : Onli)).
2. Qual a direo de cada faixa? Por exemplo, qual a probabilidade para cada faixa li de ter o
sentido de direo descendo Downli? Essa inferncia dada por i : P (li : Downli).
Consultando a rede Bayesiana da Figura 30 para os oito estados possveis dos trs
sensores, obtivemos as respostas para as questes 1 e 2. A Tabela 6 apresenta a resposta sobre
qual a provvel faixa na qual o veculo v est, enquanto a Tabela 7 apresenta a resposta sobre o
sentido de direo da faixa.
A ltima coluna da Tabela 6 mostra as faixas na qual o veculo s provavelmente est
(argmaxli P ((v : Onli))), dado as evidncias A dos trs sensores representadas nas trs primeiras
colunas. Cada sensor indica uma de duas respostas mutuamente exclusivas, assim a primeira
coluna representa os dados do sensor GPS (GoingUp) com a informao de direo em que o
carro se movimenta. Na coluna seguinte esto os dados do mapa digital (SensedTwoWayRoad)
indicando se uma rodovia de mo nica ou uma rodovia de mo dupla. Enquanto que na terceira
coluna esto os dados da cmera (SensedDashedDivider) que faz uma classificao de linha
divisria como linha contnua ou linha tracejada.
A primeira linha da Tabela 6, por exemplo, representa o estado onde o GPS indica que
o carro est descendo a rua, e o mapa digital indica que rua de mo nica, e o sistema de
viso classifica a linha divisria como linha contnua. Dado estas evidncias o n Onl3 tem a
Tabela 7: Resposta da pergunta dois a partir da rede Bayesiana da Figura 30: a probabilidade para a direo de a
faixa ser Down dado s evidncias A (expressas nas seis primeiras colunas).
GPS Mapa Cmera l1 l2 l3

SensedOn Sensed
GoingUp TwoWayRoad SolidDivider P(Downl1|A) P(Upl1|A) P(Downl2|A) P(Upl2|A) P(Downl3|A) P(Upl3|A)
0 0 0 0,99 0,01 0,99 0,01 1,00 0,00
0 0 1 0,99 0,01 0,99 0,01 1,00 0,00
0 1 0 0,01 0,99 0,76 0,24 1,00 0,00
0 1 1 0,01 0,99 0,95 0,05 1,00 0,00
1 0 0 0,00 1,00 0,01 0,99 0,01 0,99
1 0 1 0,00 1,00 0,00 1,00 0,01 0,99
1 1 0 0,00 1,00 0,61 0,39 0,99 0,01
1 1 1 0,00 1,00 0,09 0,91 0,99 0,01
Figura 31: Exemplo de trs cenrios de trfego, onde o carro est descendo uma via de mo nica.
(a) (b) (c)
maior probabilidade entre todos ns Onli da rede Bayesiana (Figura 30). Na Figura 31c temos
uma ilustrao desde caso. Na segunda linha da Tabela 6, tanto o GPS quanto o mapa digital
continuam como descritos anteriormente, contudo a viso mudou e agora percebe uma linha
tracejada. Neste caso existem duas hipteses com igual probabilidade 1 representadas nas Figuras
31a e 31b, as quais mostram um veculo na faixa l1 e na faixa l2 respectivamente. Os outros
casos na Tabela 6 so anlogos. A Tabela 6 tem alguns casos em que o sistema responde duas
em vez de um faixa, isso devido ao fato de termos nesta configurao somente oito estados de
sensores para doze estados deste domnio. Os resultados so os esperados quando comparamos
com a Tabela 5.
A Tabela 7 tem os valores de probabilidade da direo permitida em cada faixa li, dado
as evidncias representadas nas trs primeiras colunas. Tomando como exemplo a ltima linha, a
probabilidade maior para Upl1, Upl2 e Downl3, as quais so consistentes com as evidncias
de que o veculo est subindo uma rua de mo dupla e percebe uma linha tracejada. Para a outra
configurao das evidncias as direes de cada faixa so dadas de modo similar nesta tabela.
Figura 32: Rede Bayesiana relacional representando um domnio de trafego com papis e indivduos representando
veculo, faixas, e linha divisria.
3.3.2 Rede Bayesiana relacional com transitividade

Na seo anterior, devido s restries do CRALC em representar transitividade, todo o
raciocnio espacial ficou implcito, gerando uma rede especfica para aquele domnio. Para resol-
ver isso, uma segunda rede Bayesiana relacional foi gerada manualmente. Esta rede representada
na Figura 32 teve como base as regras de traduo do CRALC (seo 2.4). Esta abordagem
tem como objetivo verificar a possibilidade de utilizar os papis para representar as relaes
transitivas entre indivduos. Nessa abordagem uma rede foi gerada para cada indivduo: trs
faixas, um veculo e uma linha divisria. A gerao da rede relacional resultante no uma tarefa
manual trivial e esta rede (Figura 32) foi simplificada para utilizar a linguagem de descrio
probabilstica. Os indivduos tm diferentes relaes entre eles, essas relaes na maioria dos
casos so percebidas pelos sensores, outras so inferidas pelo raciocnio espacial formalizado
para o domnio.
Como qualquer T Box em CRALC pode ser representada por uma rede Bayesiana para
inferncia, as hierarquias de papis e os conceitos disjuntos na T Box foram manualmente trans-
formados em uma rede Bayesiana relacional. Conceitos foram traduzidos em ns da rede de tal
modo que os conceitos esquerda foram traduzidos como pais daqueles a direita. Para a disjuno,
foi criado um n Xor (ou exclusivo) que fica sempre evidenciado como verdadeiro na rede. Po-
demos ento determinar se uma faixa sobe ou desce utilizando as frmulas (3.13), (3.14) e (3.16).
Apesar destas frmulas definirem os conceitos utilizando papis, neste trabalho elas foram
definidas a partir de probabilidades condicionais dadas as evidncias dos sensores de serem
GoingUp, GoingDow, OnOneWayRoad, OnTwoWayRoad. O mesmo procedimento foi
usado para indicar o tipo da linha divisria que est relacionada a cada faixa; ou seja, a linha
divisria que est a leste da faixa. Considerou-se uma viso global e o sistema de coordenadas
fixo a rua, independente da direo do carro.
1
Diferem na terceira casa decimal
Tabela 8: Tabela de composio do cdc para o domnio de trfego
domnio de trafego e(b,c) w(b,c) eq(b,c)

eq(a,c)
e(a,b) e(a,c) e(a,c) e(a,c)
w(a,c)
eq(a,c)
e(a,c)
w(a,b) w(a,c) w(a,c)
w(a,c)
eq(a,b) e(a,c) w(a,c) eq(a,c)
Fonte: adaptado de Skiadopoulos e Koubarakis (2001).
Figura 33: Rede Bayesiana baseado na tabela de composio (Tabela 8)
Nesta abordagem, focamos no clculo de direo cardinal (cdc) para determinar em qual
faixa o veculo est localizado. Utilizamos uma ferramenta de raciocnio espacial qualitativo a
tabela de composio criando uma tabela de composio para o cdc deste domnio (Tabela 8). A
Figura 33 refere-se tabela de composio (Tabela 8) representada como uma rede Bayesiana.
Essa rede foi parte do estudo para verificar como fazer inferncias em uma rede Bayesiana
utilizando as informaes de transitividade das relaes observadas entre trs indivduos. A
partir das consideraes das caractersticas do domnio, com a Tabela 8 pode-se determinar a
P (eq(vehicle, lane)) utilizando os dados da ABox; por exemplo, se o sensor indicar uma linha
divisria a leste do veculo (e(vehicle, divider)), inferindo as linhas de diviso relacionadas a
cada faixa (e(lane, divider)), ento podemos calcular a probabilidade de cada faixa ser aquela
na qual o veculo est localizado. Intuitivamente, caso o veculo e a faixa estejam ambos leste
da linha divisria percebida pelo sensor, logo o veculo est na faixa.
e(vehicle, divider) u e(lane, divider) eq(vehicle, lane) (3.34)
Dada formalizao apresentada na seo 3.2 (e as consideraes acima), gerou-se a

rede Bayesiana relacional representada na Figura 32, onde os ns em destaque (vermelho) so
as variveis observadas, por exemplo, estado dos sensores. A rede Bayesiana da Figura 32
Tabela 9: Tabela que apresenta quantidade de vezes que uma faixa pode ocorrer dada a combinao das
caractersticas que podem ser percebidas pelos sensores.
OnOneWayRoad OnTwoWayRoad
SolidDivider DashedDivider SolidDivider DashedDivider
L1 1 0 0 0
L2 0 1 1 0
GoingDown
L3 0 1 1 1
L1 1 0 2 0
L2 0 1 0 1
GoingUp
L3 0 1 0 0
Fonte: autor.
Tabela 10: Resposta da primeira questo: "qual faixa tem maior probabilidade do carro estar localizado?"As
evidncias (A) esto expressas nas seis primeiras colunas referentes aos dados dos trs sensores.
GPS Mapa Cmera rede Bayesiana (Figura 32)

GoinUp SensedOnTwoWayRoad SensedDashedDivider argmaxli P ((v, li : eq|A))
0 0 0 l1
0 0 1 l2 t l3
0 1 0 l2 t l3
0 1 1 l3
1 0 0 l1
1 0 1 l2 t l3
1 1 0 l1
1 1 1 l2
formada por cinco redes conectadas. Alm das informaes da ABox, existem as evidncias
do conceito de disjuno (ns Xor) e dos ns que indicam se a rede representa uma faixa, um
veculo ou uma linha divisria.
Com as redes da Figura 32 possvel responder as duas questes:
1. argmaxli P ((v : li : eq)) i = 1, 2, 3 , ou seja, em qual faixa (li) o veculo (v) tem a maior
probabilidade de estar localizado?
2. i : P (li : Down) , ou seja, qual a probabilidade para cada faixa li permitir a direo
Down (descendo)?
Consultando a rede da Figura 32, para os oito estados dos trs sensores obtivemos as respostas
para as questes 1 e 2 apresentadas pelas Tabelas 10 e 11 respectivamente.
A Tabela 10 mostra qual a faixa mais provvel em que o veculo v est dirigindo
(argmaxli P ((v, li : eq))), considerando as evidncias A dos trs sensores representas nas trs
primeiras colunas os dados representando. A primeira linha da Tabela 10, por exemplo, representa
o estado onde o GPS indica GoingDown, o mapa digital indica ser uma rua de mo nica e
o sistema de viso indica uma linha contnua. Dadas estas evidncias o n li com a maior
3.4. Discusso dos Resultados 95
Tabela 11: Resposta da pergunta dois a partir da rede Bayesiana da Figura 32: a probabilidade para a direo de a
faixa ser Down dado s evidncias A (expressas nas seis primeiras colunas).
GPS Mapa Cmera l1 l2 l3

SensedOn Sensed
GoingUp TwoWayRoad SolidDivider P(Downl1|A) P(Upl1|A) P(Downl2|A) P(Upl2|A) P(Downl3|A) P(Upl3|A)
0 0 0 0,98 0,02 0,99 0,01 1,00 0,00
0 0 1 0,98 0,02 0,99 0,01 1,00 0,00
0 1 0 0,50 0,50 0,50 0,50 1,00 0,00
0 1 1 0,05 0,95 0,50 0,50 1,00 0,00
1 0 0 0,00 1,00 0,00 1,00 0,00 1,00
1 0 1 0,00 1,00 0,00 1,00 0,00 1,00
1 1 0 0,00 1,00 0,50 0,50 0,99 0,01
1 1 1 0,00 1,00 0,50 0,50 0,99 0,01
probabilidade a partir da rede Bayesiana relacional da Figura 32 o n l1. Este caso est
representado na Figura 31a. Na segunda linha da Tabela 10, o GPS e o mapa digital continuam
como descrito anteriormente, contudo a viso percebe uma linha tracejada. Neste caso, tem duas
hipteses com igual probabilidade 2 : l2 e l3, representados nas Figuras 31b e 31c respectivamente.
Todos os outros casos na Tabela 10 so anlogos.
A Tabela 11 representa a resposta para a questo 2 mostrando os valores de probabilidades
para cada faixa li (Downli, Upli), dadas as evidncias das trs primeiras colunas. Pegando a
primeira linha como exemplo, a probabilidade de ser Downli maior para as faixas l1, l2 e l3, o
que consistente com as evidncias percebidas pelos sensores de que o veculo est descendo
uma rua (GoingDown) de mo nica (SensedOnOneWayRoad). Todos os outros casos nesta
tabela so semelhantes. Nosso objetivo foi utilizar os clculos de direes cardinais como
informaes para novas inferncias em domnios reais. Portanto, esta abordagem serviu para
verificar que possvel trabalhar com transitividade das relaes entre indivduos.
3.4 Discusso dos Resultados

A rede Bayesiana da Figura 30 foi gerada automaticamente para somente um indivduo.
Esta rede foi bem sucedida, pois as respostas eram as esperadas, sendo consequncia direta da
formalizao do domnio assumido. Dado este sucesso inicial, supomos que h uma extenso
adequada de CRALC capaz de representar e raciocinar sobre domnios espaciais de qualquer
sistema de raciocnio espacial qualitativo. Para investigar esta suposio, seguimos empregando
a linguagem de descrio CRALC como base, mas com alguns recursos adicionais para lidar
com conceitos disjuntos e hierarquias de papis que aparecem nos domnios espaciais, resultando
na rede Bayesiana relacional da Figura 32, a qual gerou resultados dentro do esperado.
Neste trabalho investigou-se a formalizao de um domnio espacial como extenso de
uma lgica de descrio probabilstica bsica, CRALC. Fomos capazes de usar a expressividade
de um formalismo relacional da lgica de descrio ALC, com o tratamento de incerteza forne-
cido pelas redes Bayesianas, com o qual o modelo de sensor foi codificado. Essa formalizao
2
Diferem na terceira casa decimal
foi o primeiro trabalho a utilizar clculos de raciocnio espacial qualitativo estendido com uma
abordagem probabilstica.
Uma discusso sempre levantada que o algoritmo atual tem a restrio da definio
acclica. Essa foi uma das primeiras dificuldades encontradas na formalizao da T Box. Cada
conceito e papel deveriam ser definidos sem gerar ciclos e em uma sequncia tal, que um conceito
que esteja direita tenha sido definido anteriormente. Esse desafio foi superado renomeando
alguns conceitos.
Em CRALC frmulas de incluso para papis tm uma dificuldade adicional, uma vez
que eles podem levar s definies circulares. Hierarquias de papis tambm no fazem parte da
ALC bsico, mas foram necessrios para representar a relao entre as pistas e as suas direes e
entre o veculo e sua faixa de rodagem. Na formalizao apresentada neste trabalho, evitamos os
papis na formalizao do domnio deixando-os implcitos, representando os papis assumidos
pelos indivduos como conceitos, o que permitiu uma representao da relao espacial no
domnio utilizando o algoritmo CRALC. Numa segunda abordagem inclumos as regras de
composio proposionalizando os papis. Isto devido natureza do clculo de direo cardinal,
em que um conjunto de relaes espaciais somente uma relao acontece com o mesmo par
de indivduos. A mesma caracterstica do formalismo raciocnio espacial subjacente deve ser
explorada em outros domnios.
Alm de fornecer uma soluo para o uso de incluses de papis baseada em composio
e hierarquias de funes dentro do CRALC, este trabalho contribui com a formalizao de
preciso do sensor como frmulas T Box probabilsticos em CRALC. Nesta formalizao,
uma preciso estimada em particular foi determinada pelo modelo do sensor a partir do qual
se originou. A maior dificuldade desta tarefa, que ainda enfrentamos no nosso trabalho, a
representao de relaes transitivas, as quais so peas importantes do conhecimento espacial.
Uma considerao a fazer: formalizamos o domnio, porm no tivemos acesso a dados
reais dos sensores para estend-lo a uma aplicao real. O CRALC ainda estava em desen-
volvimento, e sem a hierarquia de papis um sistema com raciocnio espacial para aplicar em
rob mvel no seria uma tarefa a ser realizada em mdio prazo. Mas a partir do conhecimento
adquirido com as formalizaes dos domnios com CRALC codificando um raciocnio espacial,
decidimos aplicar as inferncias com redes Bayesianas a outro domnio com o qual tnhamos
mais contato e que precisava do reforo probabilstico para lidar com as incertezas dos sensores
e do ambiente real. No prximo captulo vamos mostrar este sistema de auto localizao de
um rob mvel que foi estendido combinando um filtro Bayesiano que tem como evidncias as
relaes qualitativas entre elementos do ambiente.
Parte II
Segunda Contribuio
99
4 RACIOCNIO ESPACIAL QUALITA-

TIVO PROBABILSTICO PARA LO-
CALIZAO ROBTICA
Neste captulo vamos propor e explorar um mtodo que combina teorias espaciais
qualitativas com filtro Bayesiano, para executar a tarefa de auto localizao qualitativa de um
rob mvel. O mtodo aqui apresentado foi aplicado em dois domnios com diferentes mapas
qualitativos. Em ambos os domnios as informaes foram extradas das imagens capturadas
pelo rob. O mtodo aqui proposto segue os seguintes passos:
definio do mapa qualitativo a partir de teorias espaciais topolgicas de ocluso aplicveis

aos elementos marcos do domnio;
formalizao da localizao em cada regio do mapa aplicando as teorias raciocnio

espacial qualitativo (REQ) que melhor se apliquem aos elementos marcos do domnio;
adaptao do algoritmo de filtro Bayesiano s necessidades de inferncia, ao tipo de

elementos do domnio e na formalizao da localizao e do mapa;
criao do sistema com os algoritmos para segmentao, reconhecimento de relaes

espaciais, localizao com REQ, inferncia com filtro Bayesiano.
4.1 Um Breve Histrico

Em Santos, Dee e Fenelon (2009) foi apresentada uma teoria lgica para auto localizao
qualitativa de um rob utilizando a teoria das relaes qualitativas percebveis sobre sombras,
descrita na seo 2.2.3. As tcnicas qualitativas lidam com certo grau de incerteza, seja porque as
informaes quantitativas so desnecessrias ou indisponveis. Apesar disto, durante experimen-
tos com um sistema robtico (SANTOS; DEE; FENELON, 2008; SANTOS; DEE; FENELON,
2009) percebemos que o alto grau de incerteza dos dados de viso impediam que as relaes
qualitativas fossem representadas de modo apropriado. Por exemplo, a alterao da intensidade
luminosa do ambiente impedia que o sistema de viso segmentasse sombra e objeto de modo
satisfatrio.
As inferncias com PQRS dependem da segmentao da imagem baseada em filtros de
limiares descritos na seo 2.7.2. Para obter uma boa segmentao necessrio encontrar um
limiar adequado para as mudanas de posio do rob. Em Fenelon et al. (2012) foi proposto
inferir o limiar utilizando as informaes de localizao atual, as regies vizinhas e o movimento
100Captulo 4. RACIOCNIO ESPACIAL QUALITATIVO PROBABILSTICO PARA LOCALIZAO ROBTICA
executado pelo rob. A partir dessas informaes uma previso sobre o rob continuar na mesma
regio ou de mudar de regio era inferida, quando o PQRS retornava uma regio diferente daquela
prevista, o sistema fazia uma varredura procurando por um parmetro que confirmasse a crena
na localizao, assim executando a auto calibrao. Baseado nos trabalho apresentado na seo
3.3.2, em uma primeira tentativa para obter um mecanismo de previso probabilstico, esboou-
se uma rede Bayesiana criada a partir da formalizao em PQRS do domnio apresentado em
Fenelon et al. (2012). Percebeu-se, no entanto que o que estvamos propondo era semelhante a
um filtro Bayesiano. Nesta pesquisa o PQRS combinado com filtro Bayesiano foi a abordagem
que melhor se encaixou a aplicao no rob mvel.
Assim, o que fizemos foi estender a teoria PQRS, combinando-a com um filtro Bayesiano.
O filtro Bayesiano utilizado para estimar a localizao do rob e tambm para melhorar a
segmentao, determinando o limiar dado o estado atual do rob. Contudo neste trabalho s
foi possvel aplicar o PQRS em ambiente com um nico objeto. Em ambiente com mltiplos
objetos, aplicamos o raciocnio espacial que utilizou a informao de ocluso entre pares de
objetos no lugar das relaes de ocluso entre objeto e sua sombra. O filtro Bayesiano com as
informaes espaciais qualitativas foi utilizado principalmente para estimar a auto localizao
relativa s regies definidas nos mapas qualitativos.
4.2 Mapas Qualitativos

Seguindo o mtodo, o primeiro passo definir o mapa qualitativo referente a cada
domnio. As regies foram definidas utilizando as linhas de viso com base na ocluso entre
os pares de elementos marcos. Foram utilizados para formalizao da relao de ocluso entre
elementos, o PQRS para os elementos sombra e o clculo de ocluso de regies (ROC) para os
trs pares de caixas.
Na seo 2.2.3.1 foi descrito como a teoria PQRS define as regies pelas linhas de viso
entre a fonte de luz L, um objeto o e sua sombra s, a partir da descrio de ocluso da sombra.
No entanto, para uma aplicao prtica, as regies unidimensionais 2 e 4 foram expandidas
conforme representado pelas reas hachuradas na Figura 34a. Essa modificao resulta em uma
representao qualitativa mais apropriada para que o rob execute a tarefa de auto localizao.
O mapa qualitativo (Figura 34b) tambm representa que a regio da sombra causada pela parte
superior do objeto chamada de topo da sombra (top(s)) ser utilizada para definir as regies.
Aumentando a quantidade de objeto-sombra mais regies so definidas no mapa, onde sub-
regies so formadas da sobreposio das regies relativas aos diferentes objetos. Como no
foi possvel para este trabalho utilizar um nmero maior que um objeto-sombra, optou-se por
utilizar mltiplos objetos e a percepo da relao de ocluso entre eles.
Com mltiplos objetos as regies so definidas para cada par de objetos utilizando as
relaes topolgicas como o clculo de ocluso de regio tal qual no PQRS. Para distinguir mais
4.2. Mapas Qualitativos 101
Figura 34: Representao espacial (a) das regies considerando um ambiente real, e (b) representao do mapa
qualitativo com a cinco regies distintas, mostrando os lados direito e esquerdo e as regies(Region1 at Region5 ).
As linhas de viso entre a fonte de luz L, o objeto O e sua sombra definem as fronteiras entre as regies. Neste
diagrama somente o topo da sombra utilizado na definio das regies.
(a) (b)
Fonte: (a) Santos, Dee e Fenelon (2008) (b) Fenelon et al. (2012).
Figura 35: Uma representao da posio dos objetos no contexto deste experimento.
Fonte: autor.
as regies utilizamos tanto um clculo topolgico quanto um clculo de direo. Combinando

as relaes de direo relevantes para esse sistema com as relaes de ocluso. As relaes de
direo que utilizamos considerando os dois objetos a e b do ponto de vista do observador so:
Lef t(a, b, ) significando que a est esquerda de b do ponto de vista de ;
Right(a, b, ) significando que a est direita de b do ponto de vista de ;
F ront(a, b, ) significando que a est na frente de b do ponto de vista de ;
Behind(a, b, ) significando que a est atrs de b do ponto de vista de .
As relaes Lef t e Right so simtricas entre elas (form.(4.1)) e exclusivamente dis-

juntas considerando o par, assim como as relaes F ront e Behind (form.4.4)). Essas quatro
relaes so assimtricas isoladamente (form. (4.2), (4.3), (4.5) e (4.6)). Considerando um par de
objetos convexos, os quais do ponto de vista a esta esquerda de b ento do mesmo ponto de
vista b no estar a esquerda de a. Essa consideraes esto formalizadas nos axiomas abaixo:
Lef t(a, b, ) Right(b, a, ); (4.1)

Lef t(a, b, ) Lef t(b, a, ); (4.2)
Right(a, b, ) Right(b, a, ); (4.3)
F ront(a, b, ) Behind(b, a, ); (4.4)
F ront(a, b, ) F ront(b, a, ); (4.5)
Behind(a, b, ) Behind(b, a, ). (4.6)
Uma imagem representa a cena do ponto de vista do observador (P eopleBotT M ),

portanto neste trabalho as direes acima foram definidas considerando as seguintes restries:
A posio da imagem relativa posio vertical do rob P eopleBotT M , correspondendo

posio ereta do observador.
A cmera est fixa, a imagem corresponde posio no espao, ou seja, as posies

"acima" e "abaixo" seguem as definies usuais.
Os objetos so convexos, sem buraco e sem movimento.
A imagem tem um sistema de coordenadas com a origem dos eixos na lateral direita
superior (relativo imagem).
Com a Figura 36 vamos exemplificar como so verificadas essas direes a partir do

ponto de vista do observador. Considerando os eixos de coordenadas da imagem, a lateral
esquerda e a base do objeto pode-se inferir a relao entre o par de objetos a e b. Assim, para
identificar se um objeto est direita ou esquerda do outro objeto compara-se a distncia de
Figura 36: Uma representao grfica para a definio das direes Left, Right, Front e Behind (esquerda, direita,
em frente, atrs) relativos viso do rob atravs da imagem. Os eixos de coordenadas da imagem tem origem no
canto acima-direito relativo imagem.
Fonte: autor.
Figura 37: Diagrama representando nove regies formadas pelas linhas de viso.
Fonte: autor.
ambos em relao origem do eixo x. O objeto mais prximo est posicionado esquerda do
objeto mais distante da origem de x, enquanto este est direita do objeto mais prximo da
origem de x. Para identificar qual o objeto est frente ou atrs comparamos a distncia da base
relativa origem do eixo y de ambos os objetos. O objeto mais distante est frente do objeto
mais prximo origem do eixo y, enquanto que este est atrs do objeto mais distante da origem
do eixo y. Pela Figura 36 do ponto de vista do observador podemos dizer que a est esquerda e
em frente de b, enquanto que b est direita e atrs de a.
Nove regies so definidas a partir das linhas de viso entre dois objetos conforme
diagrama da Figura 37. As linhas de viso so tangentes internas e externas relativas aos dois
objetos (A, B). Do ponto de vista de um observador que esteja sobre as linhas de viso tan-
Figura 38: As duas figuras representam as regies e as relaes espaciais percebidas em cada uma (a)As relaes
de ocluso e (b) as relaes de direo para cada regio, todas as relaes percebidas por um observador . Somente
a regio Region9 no possvel visualizar o par em nenhuma posio do observador.
(a) (b)
Fonte: autor.
gentes internas, se um objeto acabou de encostar ao outro ento a relao N onOccludesEC

percebida. Quando o observador est sobre uma linha tangente externa perceber a relao
T otallyOccludesT P P ou o seu inverso, significando que um dos objetos acabou de ser total-
mente ocluso pelo outro objeto. No entanto, diferente do que ocorreu com as regies similares
definidas com sombras (PQRS), no vamos expandir essas regies, ou seja, as linhas de fronteira
no sero definidas como regio. Podemos observar tambm que existe simetria entre as regies
assim como as regies definidas pelo PQRS.
Neste contexto, as relaes entre os objetos A e B para localizao so definidas pelas
relaes de ocluso e pela posio entre as imagens dos objetos no frame. A localizao do rob
em quase todas as regies definida a partir do que o observador pode perceber na imagem sobre
o tipo de relao entre pares de objetos (Figura 38). Deste modo, a localizao do observador
numa determinada regio definida pela conjuno de relaes do par de objetos percebida.
Abaixo as frmulas de localizao e com exemplos de imagens representadas na Figura 39 em
que A a caixa azul e B a caixa verde:
located(Region1 , , A, B) P artiallyOccludesP O(A, B, )

Lef t(A, B, ) F ront(A, B, ). (4.7)
A frmula (4.7) significa que: quando na Region1 do ponto de vista - A oclui parcialmente B
e A est esquerda e a frente de B (Figura 39a).
located(Region2 , , A, B) T otallyOccludesN T P P (A, B, )

F ront(A, B, ). (4.8)
A frmula (4.8) significa que: quando na Region2 do ponto de vista - A oclui totalmente B e
A est na frente de B. Ou seja, somente A visto e est mais prximo do observador (Figura
39b).
located(Region3 , , A, B) P artiallyOccludesP O(A, B, )

Right(A, B, ) F ront(A, B, ). (4.9)
A frmula (4.9) significa que: quando na Region3 do ponto de vista - A oclui parcialmente B
e A est direita e na frente de B (Figura 39c).
located(Region4 , , A, B) N onOccludesDC(A, B, ) Right(A, B, ). (4.10)
A frmula (4.10) significa que: quando na Region4 do ponto de vista - A e B esto livres de
ocluso e A est direita de B (Figura 39d).
located(Region5 , , A, B) P artiallyOccludesP O1 (A, B, )

Right(A, B, ) Behind(A, B, ). (4.11)
A frmula (4.11) significa que: quando na Region5 do ponto de vista - B oclui parcialmente
A e A est direita e atrs de B (Figura 39e).
located(Region6 , , A, B) T otallyOccludesN T P P I 1 (A, B, )

Behind(A, B, ). (4.12)
A frmula (4.12) significa que: quando na Region6 do ponto de vista - B oclui totalmente A e
A est atrs de B (Figura 39f).
located(Region7 , , A, B) P artiallyOccludesP O1 (A, B, )

Lef t(A, B, ) Behind(A, B, ). (4.13)
A frmula (4.13) significa que: quando na Region7 do ponto de vista - B oclui parcialmente
A e A est esquerda e atrs de B (Figura 39g).
located(Region8 , , A, B) N onOccludesDC(A, B, ) Lef t(A, B, ). (4.14)
ocluso e A est esquerda de B (Figura 39h).
located(Region9 , , A, B) N onOccludesDC(A, B). (4.15)
ocluso. Contudo, nesta regio somente um observador com campo de viso de 360 poderia
observar A e B na mesma imagem (Figuras 39i e 39j respectivamente).
Mapas qualitativos podem ser formados a partir da disposio espacial de pares de objetos
no ambiente. Para analisar o comportamento do algoritmo de raciocnio espacial qualitativo
probabilstico colocamos em nosso ambiente mais um objeto formando trs pares em cena
(Figuras 40a e 40b). No mapa qualitativo o nmero de regies depende da disposio relativa dos
objetos. Por exemplo, com os trs objetos alinhados 14 regies so formadas (Figura 40a), esta
configurao no ser utilizadas neste trabalho. Com os objetos dispostos de forma triangular
formando as 28 regies representadas no mapa qualitativo da Figura 40b, as quais so resultados
da sobreposio das nove regies de cada um dos trs pares de objetos.
Figura 39: Exemplo de uma visualizao para (a) Region1 , (b) Region2 , (c) Region3 , (d) Region4 , (e) Region5 ,
(f) Region6 , (g) Region7 , (h) Region8 , (i e j) Region9 onde os objetos esto livres de ocluso, mas o campo de
viso no permite visualizar os dois em uma mesma cena.
(a) (b)
(c) (d)
(e) (f)
(g) (h)
(i) (j)
Fonte: autor.
4.3. Definindo a Localizao do Rob 107
Figura 40: Representaes dos mapas qualitativos formados pelas linha de viso com duas configuraes de
posio que os trs objetos podem assumir neste contexto.
(a) (b)
Fonte: autor.
A seguir o prximo passo do mtodo: a definio de localizao para cada regio

conforme o mapa qualitativo da Figura 34b e exemplos das relaes entre objeto e sombra com
imagens capturadas pelo rob mvel P eopleBotT M em cada regio. Seguido da definio de
localizao referente as 28 regies do mapa da Figura 40b.
4.3 Definindo a Localizao do Rob

Nesta seo comeamos a definio da localizao nas cinco regies relativas ao mapa
da Figura 34b, com alguns detalhes sobre cada regio alm de fotos para ajudar a visualizar as
relaes entre sombra e objetos. A localizao do mapa da Figura 40b ser somente formalizadas
por seus axiomas, pois por ter exemplificado as regies e localizao para um par de objetos na
seo anterior, no repetiremos os detalhes de cada regio.
4.3.1 Localizao na regio 1

A localizao de um rob na regio 1 definida pelo frmula (4.16):
located(1, , o, s) Shadows(s, o, Scr, L)

N onOccludesDC(o, top(s), ) 6= o. (4.16)
Do ponto de vista do observador, nesta regio, o topo da sombra nunca ocluso pelo objeto que
a projetou. Uma representao do topo da sombra pode ser vista na Figura 41c onde somente
a regio que representa o topo da sombra est destacada em vermelho. Nas outras imagens
toda a regio equivalente sombra do objeto est destacada em vermelho para uma melhor
Figura 41: Imagens capturadas com o rob posicionado em distintos pontos na regio 1. A imagem (c) mostra
somente o topo da sombra em destaque. Note que o objeto no oclui a sombra.
(a) (b)
.
(c)
Fonte: autor (c) Fenelon et al. (2012).
visualizao. O topo da sombra sempre aparece desconectado do objeto em qualquer ponto da

regio 1 (Figura 41). Cada regio tem algumas caractersticas tpicas percebidas na imagem.
Como exemplo de caractersticas desta regio: a rea da sombra maior que 90% da rea do
objeto; no eixo y da imagem a sombra est abaixo do objeto. Esta regio consiste da maior parte
da rea de atuao do rob (Figura 34b), nela o objeto est sempre entre a fonte de luz e o rob.
As regies 2 so suas nicas regies vizinhas.

A regio 2 possui a segunda maior regio, considerando-se a soma de ambas regies 2
direita e esquerda (Figura 34b). A localizao na regio 2 definida pelo frmula (4.17):

N onOccludesEC(o, top(s), ) 6= o. (4.17)
Nesta regio o objeto comea a ocluir a sombra, ainda assim, a maior parte da sombra pode ser
percebida do ponto de vista de um observador. A imagem (Figura 42) aponta para as duas laterais
Figura 42: Imagens capturadas com o rob na regio 2. Note que o objeto comea a ocluir a sombra. Todavia
ainda se v a sombra do topo do objetivo e as laterais da sombra do objeto indicados em (a).
(a) (b)
Fonte: autor.
Figura 43: Imagens capturadas com o rob na regio 3. A sombra nesta regio aparece com um dos lados
totalmente ocluso pelo objeto. Existe uma conexo entre a parte superior do objeto e sua sombra projetada.
(a) (b)
Fonte: autor.
da sombra, as quais podem ser observadas na sombra projetada enquanto o observador estiver na
regio 2, entretanto uma delas aparece parcialmente. Na Figura 42 as fronteiras foram marcadas
com barbante, e a fronteira com a regio 1 aquela na qual a ocluso da lateral da sombra se
inicia. Outras caractersticas tpicas desta regio so: o tamanho da sua rea est entre 50% e 90%
do tamanho da rea do objeto por causa da ocluso; em relao ao eixo y da imagem as bases
dos retngulos que contm e definem o objeto e sombra na imagem esto aproximadamente no
mesmo nvel; a regio do topo da sombra fica totalmente desconectada do objeto. Esta regio faz
fronteira com regio 1 e tambm vizinha da regio 3.
Figura 44: Imagens capturadas com o rob na regio 4. A sombra nesta regio quase desaparece oclusa pelo
objeto. Contudo ainda existe uma conexo entre a parte superior do objeto e a sombra.
(a) (b)
Fonte: autor.

A regio 3 possui a terceira rea em extenso. A localizao na regio 3 definida pela
frmula (4.18):

P artiallyOccludesP O(o, top(s), ) 6= o. (4.18)
Do ponto de vista do observador, o topo da sombra est ocluso parcialmente pelo objeto. Nas
imagens somente uma das laterais da sombra pode ser observada (Figura 43). Outros exemplos
de caractersticas tpicas desta regio so: a rea da sombra menor que 50% da rea do objeto;
devido ocluso parcial, o topo da sombra est conectado a lateral do objeto. A regio 3 fica
localizada entre as regies 2 e 4.

Esta regio uma das menores regies da rea de atuao do rob (Figura 34b). A
localizao na regio 4 definida pelo frmula (4.19):

T otallyOccludesT P P I(o, top(s), ) 6= o. (4.19)
Do ponto de vista do observador, somente uma pequena parte da sombra do objeto percebida.
Quase todo o topo da sombra est ocluso pelo objeto. Na imagem (Figura 44) a relao entre
as reas da sombra e do objeto difere da relao na regio 3 principalmente pelo tamanho da
rea da sombra. A sombra bem menor que o objeto, aparecendo na imagem como uma regio
estreita de sombra na lateral do objeto. Esta regio vizinha das regies 3 e 5.
Figura 45: Imagem capturada com o rob na regio 5. A sombra do objeto no aparece na imagem por estar
totalmente oclusa. O observador est na regio equivalente ao ponto de vista da luz.
Fonte: autor.

A regio 5 a menor de todas as regies da rea de atuao do rob (Figura 34b). Esta
regio est na posio oposta a regio 1 e como esta nica. Tendo como vizinhas somente as
regies 4 esquerda e direita. A localizao na regio 5 definida pela frmula (4.20):

T otallyOccludesN T P P I(o, top(s), ) 6= o. (4.20)
Do ponto de vista do observador, a sombra do objeto existe, mas no pode ser percebida, pois
est totalmente oclusa pelo objeto. A caracterstica principal desta regio que somente o objeto
pode ser observado (Figura 45) na cena. Com essa regio a formalizao para a localizao no
mapa da Figura 34b est completa.
4.3.6 Localizao nas regies R1 at R28

Para o mapa da Figura 46 os elementos marcos so caixas reconhecidas pelas suas
cores diferenciadas azul, verde e vermelho, representadas pelas letras b, g e r que formam trs
pares: azul e verde (b, g); azul e vermelho (b, r); verde e vermelho (g, r), cada par com nove
regies distintas. A posio das caixas, a distncia entre elas e sua posio exata no ambiente
so desconhecidas. Um rob pode se localizar em uma das regies a partir da observao das
relaes dos objetos. Para isso utilizamos located(Ri, , b, g, r) que significa que um observador
est em determinada regio Ri, sendo i = {1, 2, . . . , 28}, relativa s trs caixas, b,g e r. As
frmulas 4.21 a 4.48 utilizam de disjunes de conjunes de relaes espaciais para cada par de
objetos para definir a localizao nas 28 regies:
located(R1, , b, g, r) P artiallyOccludesP O1 (b, g, ) Right(b, g, ) Behind(b, g, )

N onOccludesDC(b, r, ) Lef t(b, r, ) (4.21)
N onOccludesDC(g, r, ) Lef t(g, r, );
Figura 46: Mapa qualitativo da disposio espacial dos objetos e a representao das regies.
Fonte: autor.
located(R2, , b, g, r) T otallyOccludesN T P P I 1 (b, g, ) Behind(b, g, ) (4.22)

located(R3, , b, g, r) P artiallyOccludesP O1 (b, g, ) Lef t(b, g, ) Behind(b, g, )

N onOccludesDC(b, r, ) Lef t(b, r) (4.23)
N onOccludesDC(g, r, ) Lef t(g, r, ); F ront(g, r, )
located(R4, , b, g, r) N onOccludesDC(b, g, ) Lef t(b, g, ) Behind(b, g, )

N onOccludesDC(g, r, ) Lef t(g, r, ) F ront(g, r, );
located(R5, , b, g, r) N onOccludesDC(b, g, ) Lef t(b, g, ) Behind(b, g, )

P artiallyOccludesP O(g, r, ) Lef t(g, r, ) F ront(g, r, );
located(R6, , b, g, r) N onOccludesDC(b, g, ) Lef t(b, g, )

T otallyOccludesN T P P (g, r, ) F ront(g, r, ); (4.26)

P artiallyOccludesP O(g, r, ) Right(g, r, ) F ront(g, r, );

N onOccludesDC(b, r) Lef t(b, r, ) F ront(b, r, ) (4.28)
N onOccludesDC(g, r) Right(g, r, ) F ront(g, r, );
located(R9, , b, g, r) N onOccludesDC(b, g, )
N onOccludesDC(g, r, ) Right(g, r, );

P artiallyOccludesP O(b, r, ) Lef t(b, r, ) F ront(b, r, ) (4.30)

T otallyOccludesN T P P (b, r, ) F ront(b, r, ) (4.31)
located(R12, , b, g, r) N onOccludesDC(b, g, ) Lef t(b, g, ) F ront(b, g, )

P artiallyOccludesP O(b, r, ) Right(b, r, ) F ront(b, r, ) (4.32)
located(R13, , b, g, r) N onOccludesDC(b, g, ) Lef t(b, g, ) F ront(b, g, )

N onOccludesDC(b, r, ) Right(b, r, ) F ront(b, r, ) (4.33)
located(R14, , b, g, r) P artiallyOccludesP O(b, g, ) Lef t(b, g, ) F ront(b, g, )

N onOccludesDC(b, r, ) Right(b, r, ) F ront(b, r, ) (4.34)
located(R15, , b, g, r) T otallyOccludesN T P P (b, g, ) F ront(b, g, ) (4.35)

N onOccludesDC(b, r, ) Right(b, r, );
located(R16, , b, g, r) P artiallyOccludesP O(b, g, ) Right(b, g, ) F ront(b, g, )

N onOccludesDC(b, r, ) Right(b, r, ) (4.36)
located(R17, , b, g, r) N onOccludesDC(b, g, ) Right(b, g, ) F ront(b, g, )

N onOccludesDC(g, r, ) Right(g, r, ) Behind(g, r, );
located(R18, , b, g, r) N onOccludesDC(b, g, ) Right(b, g, )

N onOccludesDC(b, r, ) (4.38)

P artiallyOccludesP O1 (g, r, ) Right(g, r, ) Behind(g, r, );
located(R20, , b, g, r) N onOccludesDC(b, r, ) Right(b, r, )

T otallyOccludesN T P P I 1 (g, r, ) Behind(g, r, ); (4.40)

N onOccludesDC(b, r, ) Right(b, r, ) Behind(b, r, ) (4.41)
P artiallyOccludesP O1 (g, r, ) Lef t(g, r, ) Behind(g, r, );

N onOccludesDC(b, r, ) Right(b, r, ) Behind(b, r, ) (4.42)
N onOccludesDC(g, r, ) Lef t(g, r, ) Behind(g, r, );

P artiallyOccludesP O1 (b, r, ) Right(b, r, ) Behind(b, r, ) (4.43)
located(R24, , b, g, r) T otallyOccludesN T P P I 1 (b, r, ) Behind(b, r, )

N onOccludesDC(g, r, ) Lef t(g, r, ) Behind(g, r, ); (4.44)

P artiallyOccludesP O1 (b, r, ) Lef t(b, r, ) Behind(b, r, ) (4.45)


N onOccludesDC(g, r, );
4.4. Filtro Bayesiano 115

N onOccludesDC(g, r, ) Right(b, g, ).
Assim, com a formalizao utilizando raciocnio espacial qualitativa para localizao em

cada uma das regies relativas aos mapas qualitativos, o filtro Bayesiano vem para completar
nosso algoritmo raciocnio espacial qualitativo probabilstico, e ser descrito na prxima seo.
4.4 Filtro Bayesiano

Essa etapa consiste em adaptar o filtro Bayesiano s necessidades de resposta do sistema.
O tipo de tcnica de viso utilizada deve ser considerado caso o filtro Bayesiano tenha influncia
em algum parmetro, como foi o caso no domnio com informao de sombras que alm da
localizao precisou de uma interferncia em seu parmetro de viso. O modelo de imagem deve
ser criado a partir das relaes que definem as localizaes, enquanto que o modelo de transio
a partir do conceito de um diagrama de vizinhana sobre um mapa qualitativo.
O filtro Bayesiano um algoritmo recursivo dividido em duas etapas, a etapa de previso
e a de atualizao de medidas. Em ambos os filtros o estado st sempre indica a regio onde o
rob est localizado e as informaes espaciais qualitativas obtidas a partir das imagens so
evidncias, as quais so representadas por (et ). A seguir os filtros Bayesianos adaptados para
cada um dos domnios.
4.4.1 Filtro Bayesiano sobre informaes qualitativas do PQRS

Para o mapa da Figura 34b as evidncias so termos das relaes do PQRS. O sistema
deve inferir em qual a regio st o rob est localizado, e tambm o limiar T h utilizado para
segmentar objeto e sombra nas imagens, ambos devem maximizar a distribuio de crena
do estado atual bel(st ) ou seja P (st , T h|e0:t ) que a probabilidade da regio st e o limiar T h
condicionada a todas as evidncias percebidas (e0:t ) . Para calcular essa distribuio de crena
utilizamos:
bel(st ) = P (st , T h|e0:t ) (4.49)

= P (st , T h|e0:t1 , et )
= P (et , T h|st , e0:t1 )P (st |e0:t1 ),
onde a constante de normalizao. Com a hiptese de Markov, o estado seguinte indepen-

dente das evidncias anteriores e0:t1 ; assim:
bel(st ) = P (et , T h|st )P (st |e0:t1 ). (4.50)
Esta frmula (4.50) representa a atualizao de medidas. O primeiro termo P (et , T h|st ) o
modelo da imagem (form.(4.50)) e incorpora a nova evidncia et . O segundo termo a previso
para o estado atual, ou seja, a crena posterior P (st |e0:t1 ) = bel(st ), esta deve ser calculada
antes de incorporar a evidncia et .
A crena posterior P (st |e0:t1 ) representa o passo de previso do estado st , obtido
previamente pelo condicionamento no estado anterior st1 , consequentemente,
bel(st ) = P (st |e0:t1 )

= P (st |st1 , e0:t1 )P (st1 |e0:t1 )
X
st1
= P (st |st1 )P (st1 |e0:t1 ).

X
(4.51)
st1
Na frmula (4.51) o termo P (st |st1 ) o valor de probabilidade da transio no estado st , e

representa o modelo de transio. Para obter P (st1 |e0:t1 ) marginalizamos em T h a distribuio
de crena em bel(st1 ) (form.(4.49)):
P (st1 |e0:t1 ) = P (st1 , T h|e0:t1 ).

X
(4.52)
Th
Portanto, a crena posterior ou predio resultado da combinao do modelo de transio com

a crena do estado anterior, assim substituindo a frmula (4.52) na frmula(4.51) temos que
(form. 4.53):
bel(st ) = P (st |e0:t1 ) = P (st |st1 ) P (st1 , T h|e0:t1 ).

X X
(4.53)
st1 Th
E finalmente, substituindo frmula (4.54) na frmula (4.50) temos a crena no estado atual dada
por (form. 4.54):
bel(st ) = P (et , T h|st ) P (st |st1 ) P (st1 , T h|e0:t1 )

X X
st1 Th
= P (et , T h|st )bel(st ). (4.54)
Na seo seguinte est descrito o filtro Bayesiano para a auto localizao com mltiplos objetos.
4.4.2 Filtro Bayesiano para auto localizao com mltiplos objetos

Para o mapa qualitativo da Figura 46 o filtro Bayesiano foi utilizado para inferir a regio
onde o rob est localizado. Essa localizao representado pelo estado st que maximiza a
distribuio de crena bel(st ). Com um valor do modelo de imagem para as dados de relaes
espaciais percebidas et , e a distribuio de crena posterior bel(st ) , temos a distribuio de
crena do estado atual para todos os st dada pela frmula (4.55):
bel(st ) = P (et |st )bel(st ). (4.55)
A etapa de previso calcula a distribuio de crena posterior bel(st ) baseado na distri-

buio de crena do estado anterior bel(st1 ). A previso bel(st ) obtida pela soma do produto
Figura 47: Mapa qualitativo das reas de atuao divididas em oito regies.
Fonte: autor.
do modelo de transio com a distribuio de crena do estado anterior (form. (4.56)):
bel(st ) = P (st |st1 )bel(st1 ).

X
(4.56)
st1
A seguir a descrio sobre como os modelos de imagem e transio foram formados.
4.4.3 Modelo de imagem

O modelo de imagem um dos fatores que fazem parte da etapa de atualizao de
informao de nosso filtro Bayesiano. O modelo de imagem o valor de probabilidade de
que uma relao seja percebida na imagem dado a regio em que o rob est. A partir da
localizao em cada regio formalizada nas sees anteriores, as evidncias so as relaes entre
os elementos observadas pelo rob.
Para o sistema com sombras as evidncias so as relaes entre a sombra e objeto
percebidas pelo rob. A localizao foi formalizada pela teoria PQRS. O sistema de viso
computacional depende do valor de limiar. Assim o modelo deve indicar (para cada limiar) a
frequncia em que as evidncias ocorrem para cada regio. O modelo de imagem uma matriz
com a porcentagem de relaes por regio para cada limiar.
Como no sistema de auto localizao com sombras (seo 4.4.1). A formalizao da
localizao feita com a disjuno de conjunes de relaes espaciais entre os pares de ele-
mentos (caixas). O modelo de imagem indica os valores de probabilidade de o sensor perceber
corretamente a evidncias et dado que ele est localizado na regio relacionada a essa evidncia
st representado pelo termo P (et |st ).
4.4.4 Modelo de transio

O modelo de transio representa a transio do rob ao passar de uma regio para
outra. Esse modelo utilizado na etapa de previso do filtro Bayesiano. Ao considerar o mapa
qualitativo da Figura 47 a probabilidade de mudana entre duas regies depende em parte do
tamanho da regio. Assim, uma regio grande tem probabilidade maior que o rob continue
Figura 48: Diagrama conceitual de vizinhana (CND) das relaes que determinam a regio na qual o rob estava
localizado. As transies esto representadas pelas setas e a mudana ocorre sempre para uma relao (regio)
vizinha.
Fonte: adaptada de Cui, Cohn e Randell (1992).
nessa regio, isto representado como uma constante (numeral) na Tabela 12. A outra parte
depende do movimento realizado pelo rob.
O deslocamento do rob pela rea de atuao segue o conceito espacial de transio
contnua, do mesmo modo que o conceito de transio de relaes do diagrama conceitual de
vizinhana (CND) discutido na seo 2.2. A Figura 48 representa um CND das transies das
relaes que so percebidas em cada uma das regies do mapa da Figura 47. Em cada regio
ocorre uma relao diferente entre sombra e objeto (Figura 48). Podemos afirmar que cada
relao tem um conjunto de caractersticas que a distingue. Algumas dessas caractersticas
podem ser compartilhadas, principalmente durante uma transio entre as relaes vizinhas. Ao
analisar as imagens com sombra e objetos as relaes entre ambos mudam conforme o rob
se desloca. Por esse motivo, utilizamos um fator w que o valor proporcional ao conjunto de
caractersticas observadas para cada relao vinculada a uma regio. Na Tabela 12 este fator
modula a probabilidade da mudana de estado. Por exemplo, considerando duas regies vizinhas,
quando o rob se desloca em direo a uma das regies vizinhas as caractersticas desta regio
aumentam enquanto que as caractersticas daquela que o rob se afasta diminuem.
O modelo de transio para mltiplos objetos foi criado de modo anlogo ao modelo
de transio para o mapa da Figura 47 (sombra-objeto). Para o mapa (Figura 46) o modelo de
transio uma matriz 28 x 28 com os valores de probabilidade da transio de uma regio
para outra do mapa. Cada valor deste modelo compe-se de um nmero real fixo associado a
uma funo. O valor real fixo baseado na configurao do mapa (Figura 46) considerando
a vizinhana e o tamanho da regio. Intuitivamente em regies maiores a probabilidade de
continuar nelas maior. A funo est relacionada a percepo de movimento atravs da imagem,
quando o rob se aproxima de uma fronteira, algumas caractersticas que definem as relaes
espaciais podem ser observadas, o que permite distinguir entre as regies vizinhas, aquela que o
rob est se direcionando, reforando o valor de probabilidade do modelo de transio. Na Figura
49 uma ilustrao topolgica das 28 regies como ns, e as transies entre regies vizinhas
representadas pela seta continua, a seta tracejada so para regies que no tm fronteiras, mas
esto prximas.
A prxima etapa refere-se a determinar os algoritmos baseados nas formalizaes de
localizao que fazem parte do sistema responsvel pela inferncia de localizao do rob.
Tabela 12: O modelo de movimento considerando que o rob tem uma navegao no sentido horrio. Este modelo
baseado no tamanho qualitativo e na transio das regies. O valores so alterados por uma funo de mudana
percebida w que representa a paralaxe causada pelo movimento do rob
Estados para st =Region1 st =Region2 st =Region3 st =Region4 st =Region5

sentido horrio
st1 =Region1 right 0,90w 0,10w 0,00 0,00 0,00
st1 =Region2 right 0,01w 0,80w 0,19w 0,00 0,00
st1 =Region3 right 0,00 0,01w 0,75w 0,24w 0,00
st1 =Region4 right 0,00 0,00 0,01w 0,70w 0,29w
st1 =Region5 0,00 0,00 0,00 0,35w 0,65w
st1 =Region4 left 0,00 0,00 0,29w 0,70w 0,01w
st1 =Region3 left 0,00 0,24w 0,75w 0,01w 0,00
st1 =Region2 left 0,19w 0,80 w 0,01 w 0,00 0,00
st1 =Region1 left 0,99 w 0,01w 0,00 0,00 0,00
Figura 49: Representao das regies como ns, e das transies entre regies prximas como setas: setas
contnuas regies com fronteira, tracejadas regies sem fronteira entre elas.
Fonte: autor.
Figura 50: Janelas para calibrao manual dos parmetros de viso utilizados no filtro de limiar para segmentar
objeto e sombra, os valores escolhidos pela barra de rolagem ficam indicados esquerda da barra. Da esquerda para
direita da figura: define o limiar T h que separa objeto e sombra do ambiente; define o limiar que separa objeto da
sombra; define o limiar que separa a sombra do objeto.
Fonte: autor.
4.5 Algoritmos Utilizados no Sistema de Auto Localizao

Neste sistema, existe um algoritmo principal que captura as imagens, outro responsvel
pelo reconhecimento dos objetos, outro pelo reconhecimento das relaes espaciais entre os
elementos, outro pela inferncia de localizao com raciocnio espacial que retorna ao algoritmo
principal a evidncia que ser utilizada pelo filtro Bayesiano. Ambos os algoritmos principais
(Algoritmo 1 e Algoritmo 3) inicializam-se com um valor de distribuio de crena igual para
todas as regies, isso porque o rob pode iniciar em qualquer regio do mapa. O Algoritmo 1
executa uma etapa na qual um operador deve executar uma calibrao manual dos parmetros de
viso. Para cada imagem capturada os algoritmos principais chamam repetidamente o algoritmo
que retorna a evidncia com mxima probabilidade P (E) (Algoritmos 2 e 4).
4.5.1 Algoritmo de auto localizao e auto calibrao com PQRS pro-

babilstico
O Algoritmo 1 inicializa o sistema com uma distribuio de crena posterior uniforme
sobre a posio do rob (linha 1). A linha 2 chama a funo de calibrao dos parmetros de
viso, os limiares (inclusive T h) so escolhidos pelo operador atravs de trs janelas como
aquelas na Figura 50, assumindo assim que o parmetro T h inicial garante uma segmentao
confivel.
A calibrao realizada no canal de intensidade luminosa (V ) sobre a imagem capturada
pelo rob. Cada uma destas janelas tem uma barra, onde possvel variar os valores de 0 a
255. O parmetro T h o limiar que separa na imagem o plano de fundo dos alvos, ou seja,
aquele que deve ser alterado durante o processo. Os outros dois parmetros s e o so limiares
para segmentar sombra e objeto respectivamente e no so alterados depois de calibrados
(Algoritmo 1 - linha 2). Aps efetuar a calibrao dos parmetros de viso, inicializa-se a captura
4.5. Algoritmos Utilizados no Sistema de Auto Localizao 121
de imagens do ambiente para auto localizao. Os frames capturados em sequncia so indicados

no algoritmo por t.
Algorithm 1 T HRESHOLD AN D P OSIT ION ()

1: bel(S1 ) = P (S0 ) = [0.2, 0.2, 0.2, 0.2, 0.2]
2: Calibration(th, Scene, )
3: while (1) do
4: et max P ERCEP T ION ACT ION (th, image, )
5: bel(St ) = P (St , T h|e0:t ) = P (et , T h|St ) bel(St )
6: (st , th) arg maxst ,th P (St , T h|e0:t )
P (St |et ) T h P (St , T h|e0:t )
P
7:
bel(St+1 ) = st P (St+1 |st )P (st |et )
P
8:
9: end while
Algorithm 2 P ERCEP T ION ACT ION (th, Scene, )

1: Segment Scene using the threshold th to obtain a caster O and the top of its shadow top(S).
2: if caster and shadow were found then
3: P (e = DC) N onOccludesDC(O, top(S), )
4: P (e = EC) N onOccludesEC(O, top(S), )
5: P (e = P O) P artiallyOccludesP O(O, top(S), )
6: P (e = T P P I) T otallyOccludesT P P I(O, top(S), )
7: else
8: if only caster was found then
9: P (e = N T P P I) T otallyOccludesN T P P I(O, top(S), )
10: else
11: return et1 ;
12: end if
13: end if
14: return arg maxe P (E);
O Algoritmo 2 retorna a relao espacial que teve o maior nmero de

caractersticas percebidas. As caractersticas extradas da imagem I(x, y) refe-
rentes ao reconhecimento do par objeto-sombra. As informaes de caracte-
rsticas utilizadas para definir o tipo de relao que ocorre entre o par so:
Tabela 13: Tabela com os valores que diferenciam as caractersticas em cada relao.
Caracterisitica DC EC PO TPPI
1 maior que -1 entre(-25 , 23) entre(-37,-4) menor que -14
2 maior que -72 entre(-136,-48) menor que -66 entre(-100,-78)
3 entre(113,201) maior que 72 entre(33,157) menor que 37
4 maior que 83 entre(68,163) entre(76,205) menor que 104
5 maior que 0,64 maior que 0,71 entre(0,33,0,79) menor que 0,41
6 maior que 9600 entre(4525,17403) entre(1903,8011) menor que 2376
7 entre(11,82) maior que 11 entre(4,54) entre(2,38)
8 menor que 87 entre(4,88) maior que 1 menor que 71
9 zero menor que 16 menor que 25 menor que 40
10 maior que 11 entre(32,126) entre(6,132) entre menor 118
Fonte: autor.
1. A distncia em y entre as bases dos retngulos limitadores da sombra e do objeto.
2. A distncia em y entre o topo do retngulo limitador da sombra e a base do objeto.
3. A largura do retngulo limitador da sombra.
4. A altura aumentada em 40% do retngulo limitador da sombra.
5. A razo entre os dois valores acima (altura/ (1.4xlargura)).
6. A rea do retngulo limitador da sombra.
7. Total de pontos conectados entre a sombra e a base do objeto.
8. Total de pontos conectados entre a sombra e a lateral do objeto.
9. Total de pontos conectados entre o topo da sombra e o topo do objeto.
10. Total de pontos conectados entre a sombra e o objeto.
Na Tabela 13 esto os valores que cada uma das caractersticas listadas acima pode
assumir dependendo da relao espacial entre o objeto e sombra. A primeira coluna representa as
caractersticas, enquanto que as colunas seguintes representam cada relao espacial observvel
entre sombra e objeto. Cada linha representa uma caracterstica e os valores que ela pode assumir
na ocorrncia de cada relao espacial (DC, EC, P O, T P P I). Por exemplo, na primeira linha
a caracterstica 1 referente a distncia relativa em y entre as bases dos retngulos limitadores
da sombra e do objeto. Em DC (maior que -1) de modo qualitativo significa que a base do
retngulo limitador da sombra est na mesma altura ou abaixo da base do retngulo do objeto.
De modo anlogo para EC a base do retngulo limitador da sombra pode estar um pouco abaixo
ou um pouco acima, enquanto que estar sempre acima da base do retngulo do objeto para as
relaes espaciais P O e T P P I. Notem que alguns valores podem ser comuns para mais de uma
relao espacial. As caractersticas de 1 a 6 referem-se posio relativa entre os retngulos que
envolvem a sombra e o objeto. As caractersticas de 7 a 10 so relativos ao nmero de pontos
conectados entre o objeto e a sombra.
A evidncia pode ser uma das relaes DC, EC, P O, T P P I ou N T P P I. Caso o
objeto no tenha sombra na imagem, ento somente a relao N T P P I analisada. Assim, no
algoritmo 1 dada a evidncia (linha 4 ), a linha 5 calcula a crena para todas as cinco regies
representadas por St , no intervalo de limiar ([T h 5, T h + 5]). Com a crena das regies e os
dois modelos, as prximas linhas do algoritmo 1 calculam a previso e o limiar T h para serem
utilizados em t + 1. A linha 6 d o resultado sobre a regio atual (st ) e o limiar (T h) que ser
utilizado no prximo frame. O filtro Bayesiano manipula dois modelos de probabilidades, o
modelo de imagem e o modelo de transio. As duas linhas finais no algoritmo 1 so referente a
previso, a crena atual para todos estados (dada a evidncia) calculada na linha 7. O modelo de
transio que diz respeito transio entre as regies est representado na linha 8 (P (St+1 |st )).
Com os valores do modelo de transio (Tabela 12) e aqueles calculados na linha 7, na linha 8
calculado a previso da distribuio de crena de cada estado para o prximo frame.
4.5.2 Algoritmo de auto localizao REQ probabilstico

O Algoritmo 3 inicializa o vetor de previso com uma distribuio de crena uniforme
para todas as regies (linha 1) (seo 4.4.2). O Algoritmo 3 entra em repetio na linha 2 ficar
executando a auto localizao repetidamente, a partir de chamadas ao Algoritmo 4 na linha 3,
que retorna um vetor de evidncias.
O Algoritmo 4 retorna como evidncias as regies com mxima possibilidade a partir da
inferncia sobre a localizao com os dados de imagem, e conhecimento do contexto formalizado
utilizando o clculo de ocluso combinado com um clculo de direo. Na linha 6 do Algoritmo
4 a funo calcula todas as localizaes possveis em valores no intervalo [0, 1]. Esse valor foi
definido pelo nmero de predicados das frmulas 4.21 at 4.48 que so verificados. Por exemplo,
uma frmula que tem todas as suas relaes observadas recebe valor mximo 1, enquanto que
aquela que tem 3 de 4 predicados observados recebe o valor de 0,75. Este algoritmo diferente do
utilizado no PQRS todos os mximos so considerados, deste modo o resultado pode indicar uma
ou mais regies como evidncias. A quantidade de regies que a inferncia lgica retorna como
resposta inversamente proporcional quantidade de dados na imagem observados (Algoritmo
4 - linha 6). Essas evidncias sero utilizadas pelo filtro Bayesiano.
O filtro Bayesiano calcula a distribuio de crena da localizao do rob (bel(St )) em
todas as regies st e todas as evidncias et (linha-4). Para cada evidncia ser calculado uma
distribuio de crena para todos os estados st com o produto valor do modelo de imagem e a
crena anterior (linha 4). No Algoritmo 3 a localizao do rob st aquela que tiver maior valor
de crena (linha 5). A ltima etapa calcular a previso para t + 1 (bel(st+1 )), marginalizando
em st o produto da crena P (st |et ) com o modelo de transio P (st+1 |st ).
Algorithm 3 REGION P OSIT ION ()

1: bel(S1 ) = P (S0 ) = [ 28
1 1
, . . . , 28 ]
2: while (1) do
3: Et max P ERCEP T ION ACT ION (image, )
4: bel(St ) = P (St |E0:t ) = P (Et |St ) bel(st )
5: (st, et ) arg max P (St |Et )
bel(St+1 ) = P (st+1 |st )P (st |et )
P
6:
st
7: end while
Algorithm 4 P ERCEP T ION ACT ION (Scene, )

1: Segmentao e deteco de caixas.
2: Reconhecimento das relaes espaciais
3: for all Para todas regions Ri do
4: P (e = Ri) (located(Ri, , b, g, r))
5: end for
6: return arg maxe P (E);
Esse o sistema de modo geral, que depende de um sistema de viso, capaz de reconhecer
os elementos e as caractersticas que determinam as relaes entre eles. A seguir vamos descrever
esses algoritmos comeando pelos algoritmos de reconhecimento dos elementos alvos.
4.5.3 Algoritmo deteco de sombra e objeto.

O Algoritmo 5 refere-se ao sistema de viso computacional responsvel pela deteco e
reconhecimento de sombras e objetos. A funo de deteco foi desenvolvida para um ambiente
predominantemente claro e objeto preto. As tcnicas utilizadas so aquelas bem estabelecidas e
disponveis na biblioteca OpenCV (seo 2.7).
O primeiro filtro de limiar utilizado o mais importante. Esse filtro elimina os elementos
da cena que no sejam o objeto e a sombra. A imagem RGB convertida para o espao de cores
HSV. A imagem HSV divida em seus canais resultando em trs imagens em escala de cinza
H,S e V . Um filtro de limiar passa baixa (seo 2.7.2) aplicado na imagem V (Figura 51a).
Todos os pixels com valor abaixo do valor de limiar th so preservados enquanto os outros
recebem o valor zero (form.( 4.57)). Como resultado objeto, sombra e alguns elementos do
ambiente permanecem na imagem de objeto e sombra (Figura 51b). Os elementos do fundo que
permanecem so derivados da penumbra que tem valor da intensidade luminosa na mesma faixa
que a sombra.
V (x, y), se V (x, y) < ;

Imagem com objeto e sombra (x, y) =

(4.57)
0 em outro caso.
Algorithm 5 Detecta sombra e objeto (th, Scene)

1: H,S e V Converte Scene em RGB para HSV e separa em canais ;
2: if (V (x, y) > th) then
3: V (x, y) zero;
4: end if
5: DEF IN E REGIAO(V , verde);
6: if (S(x, y) < Sat ) then
7: S(x, y) zero;
8: end if
9: for i = 0 toi = total de ROI do
10: if (ROI equivalente em S tem mais de 1% de saturao) then
11: ROI[i] true;
12: else
13: ROI[i] false;
14: end if
15: end for
16: Criar mscara com ROI[True]
17: Imagem de objeto e sombra mscara em V
18: Imagem de objeto filtro de passa baixa na Imagem de objeto e sombra com limiar o .
19: Imagem de objeto filtro morfolgico de fechamento na Imagem de objeto;
20: DEF IN E REGIAO(Imagem de objeto, azul);
21: for all ROI(x,y) do
22: if Imagem de objeto(x,y) > 0 then
23: ROI com objeto mscara;
24: end if
25: end for
26: Imagem de sombra mscara em Imagem de objeto e sombra;
27: Imagem de sombra filtro de passa alta na Imagem de sombra com limiar s .
28: Imagem de sombra filtro morfolgico de abertura na Imagem de sombra;
29: DEF IN E REGIAO(Imagem de sombra, vermelho);
Algorithm 6 DEF IN E REGIAO(Imagem, Cor)

1: Segmentao da Imagem por componentes conectados;
2: if (Cor = vermelho) then
3: Guarda informaes() das regies de sombra segmentadas;
4: else
5: if (Cor = azul) then
6: Guarda informaes() das regies de objetos segmentadas;
7: else
8: if (Cor = verde) then
9: Guarda informaes() das regies de interesse ROI segmentadas;
10: total de ROI total de ROI encontrados.
11: end if
12: end if
13: end if
14: informaes ( rea, contorno da rea, retngulo que contm rea, quantidade encontrada);
Figura 51: Exemplo de sequncia da segmentao de um quadro na deteco ROI:(a) canal V, (b) canal V aps
limiar acima , (c) filtro morfolgico, (d) retngulo verde indica regies candidatas a regio de interesse (ROI), (e)
canal S aps filtro passa-alta sat , (f) mscara ROI.
(a) (b)
(c) (d)
(e) (f)
Fonte: autor.
O prximo passo procurar no imagem resultante por regies que so candidatas a

serem as regies de interesse (ROI) 1 . Para isso aplicado um filtro morfolgico de abertura.
Depois so encontradas as regies conectadas (seo 2.7.5). O filtro morfolgico de abertura
serve para eliminar pequenos grupos conectados que so considerados como rudos na imagem.
Por exemplo, a imagem da Figura 51b tem inicialmente 322 grupos de componentes conectados,
este nmero reduzido para dez depois de aplicado o filtro morfolgico de abertura, a Figura 51c
mostra o resultado desde procedimento. As reas da imagem candidatas a ROI so escolhidas
dentre aquelas que possam ter o objeto. No exemplo da Figura 51d, dentre os dez grupos
conectados dois passaram pelo filtro e esto indicas com retngulos na imagem. Uma mscara
criada com as regies candidatas a ROI.
Neste trabalho, a regio de interesse deve conter pelo menos parte do objeto alvo. Na
imagem a regio equivalente ao objeto alvo alm da baixa intensidade luminosa, possu alto
valor de saturao. Aplica-se um filtro de limiar passa alta na imagem S equivalente ao canal
de saturao, onde somente os valores altos permanecem (Figura 51e). As regies ROI na
imagem do objeto e sombra que tm mais de 1% de saturao nas regies equivalentes da
imagem S so consideradas verdadeiras. Esse filtro serve para eliminar boa parte daquelas
regies candidatas onde somente a penumbra est presente. No caso da Figura 51e a regio de
penumbra permaneceu, pois existe uma sobreposio dos retngulos que indicam a regio de
ROI, o que fez com que parte do objeto estivesse dentro de ambas as regies na imagem de
saturao. Com as regies ROI verdadeiras uma nova mscara criada para ser utilizada na
deteco de objetos (Figura 51f).
Para detectar o objeto, primeiro aplica-se a nova mscara na imagem com objeto e
sombra, e como resultado permanece as reas que podem ter o objeto alvo (Figura 52a). Como o
objeto preto, sua intensidade luminosa mais baixa que a intensidade luminosa da sombra,
ento aplicado o filtro de limiar passa baixa, com o limiar o definido na calibrao inicial.
Como mostra a frmula (4.58), os valores abaixo do limiar permanecem e os outros ficam com
valor zero. Na imagem resultante aplicado um filtro morfolgico de fechamento (Figura 52b)
para logo em seguida encontrar os componentes conectados, os quais definem a regio do objeto.
V (x,y), se V (x, y) < o ;

Imagem com objeto e sombra (x, y) =

(4.58)
0 em outro caso.
As informaes da regio de cada objeto so guardadas para serem utilizadas posterior-

mente. As informaes so caractersticas da regio do objeto, tais como: tamanho de rea, dados
do menor retngulo que contm a rea do objeto, dados do contorno, se objeto est encostado
nas bordas da imagem, dados da base do objeto (Figura 52c) e o total de objetos encontrados. A
Figura 52d apresenta o exemplo de uma imagem com o retngulo desenhado indicando o objeto
alvo encontrado. Novamente as regies ROI so analisadas e aquelas que no tm todo o objeto
1
do ingls: Region of Interest (ROI)
Figura 52: Exemplo de sequncia da segmentao de um quadro na deteco de objetos: (a) Imagem objeto e
sombra depois de aplicado a mscara, (b) filtro de limiar abaixo e filtro morfolgico, (c) imagem binria da base do
objeto, (d) retngulo azul indica objetos encontrados na segmentao, (e) ltima mscara ROI criada pelo sistema
de viso.
(a) (b)
(c) (d)
(e)
Fonte: autor.
Figura 53: Exemplo de sequncia da segmentao de um quadro na deteco de sombras: (a) Imagem com objeto
depois de aplicada a segunda mscara, (b) Imagem aps filtros de limiar acima e morfolgico de abertura, (c)
retngulo limitador vermelho indicando a sombra localizada.
(a) (b)
(c)
Fonte: autor.
dentro so apagadas da mscara. Somente os retngulos com objetos so mantidos criando uma
nova mscara (Figura 52e).
Aplicando a nova mscara na imagem com sombra e objeto obtm-se uma imagem
que mantm as regies que possuem objeto alvo (Figura 53a). Este procedimento equivale a
uma subtrao de fundo deixando as regies com os elementos alvos. Quando comparamos a
Figura 52a (que mostra a imagem obtida com a primeira mscara) com a Figura 53a, nota-se que
toda a regio de penumbra no existe mais, permanecendo somente as regies compreendidas
pelo retngulo limitador da regio ROI com os objetos alvos.
Para segmentar a sombra, aplicado o filtro de limiar acima com o limiar s determinado
na calibrao inicial. Os valores de intensidade maiores que s permanecem e todos os outros
vo para zero conforme frmula (4.59).
V (x, y), se V (x, y) > s ;

Imagem sombra(x, y) =

(4.59)
0 em outro caso.
Figura 54: Exemplo de segmentao do objeto e sua sombra. O topo da sombra tambm detectado pelo sistema
de viso conforme destacado nesta imagem.
Como resultado da frmula (4.59) obtm-se uma imagem onde somente a regio equi-
valente a sombra permanece. Nesta imagem com sombras aplicado um filtro morfolgico de
abertura para eliminar rudos (Figura 53b), e achando os componentes conectados para que seja
determinada a regio equivalente a sombra e suas informaes. Caso uma regio de sombra se
encontre totalmente dentro do retngulo que limita o objeto, esta no ser considerada como
sombra, pois em geral um reflexo da luz no objeto. Para os demais casos, guardam-se as
caractersticas das regies de sombra, tal como rea, os dados do menor retngulo que contm a
rea da sombra, se a sombra est encostada nas bordas da imagem e a quantidade de sombras
existentes na imagem, a regio equivalente ao topo da sombra. Uma sombra tem valores de
intensidade diferentes, e a intensidade dos pixels do topo da sombra so mais altos. Assim, com
um filtro de limiar possvel localizar o topo da sombra.
Como exemplo a Figura 53c mostra a sombra encontrada limitada pelo retngulo ver-
melho, enquanto que a Figura 54 mostra a localizao do objeto e da sombra limitados pelos
retngulos azul e vermelho respectivamente. A regio equivalente ao topo da sombra est desta-
cada em branco (Figura 54). Esse foi o algoritmo responsvel pela deteco de sombra e objeto,
a seguir o algoritmo para deteco de objetos.
4.5.4 Algoritmo de deteco de objetos

O sistema de viso para detectar as caixas coloridas foi desenvolvido de forma anloga
ao utilizado no sistema de sombras. Na linha 1 do Algoritmo 7 a imagem em RGB (Figura
55a) convertida para o espao de cores HSV e dividida em trs imagens com as informaes
de cada canal H,S e V . Como as caixas tm alto grau de saturao (Figura 55b), um filtro de
limiar passa alta foi utilizado no canal de saturao S (linha 2, Figura 55c), as regies com alta
saturao so definidas como regies de interesse ROI (linha 6). Uma mscara criada com ROI
Algorithm 7 Detecta objeto (Scene)

1: H,S e V Converte Scene em RGB para HSV e separa em canais ;
2: if (S(x, y) < Sat ) then
3: S(x, y) zero;
4: end if
5: DEF IN E REGIAO(S, verde);
6: if (ROI equivalente em S > 1% de saturao) then
7: ROI true;
8: end if
9: mscara todos os ROI[True]
10: Imagem de objetos mscara em V
11: Imagem de objeto vermelho filtro de passa faixa vermelho em Imagem de objetos.
12: Imagem de objeto verde filtro de passa faixa verde em Imagem de objetos.
13: Imagem de objeto azul filtro de passa faixa azul em Imagem de objetos.
14: DEF IN E REGIAO(Imagem de objeto vermelho, azul);
15: DEF IN E REGIAO(Imagem de objeto verde, azul);
16: DEF IN E REGIAO(Imagem de objeto azul, azul);
definindo regies onde as caixas possam estar presentes (Figura 55e). Em todos os casos para
definir as regies (ROI, objeto, sombra) foi utilizado o Algoritmo 6: logo aps aplicar um filtro
de limiar (Figura55c); utilizamos um filtro morfolgico de abertura que elimina parte do rudo
na imagem; para em seguida localizar as regies conectadas (Figura 55d). A localizao de cada
regio conectada na imagem determinada pelo menor retngulo que a contm (Figura 55f).
Os objetos tm cores diferentes, vermelho, azul e verde, assim trs imagens so criadas
aplicando a mscara no canal de matiz H. Aplicando um filtro de limiar passa faixa no canal
de matiz (H) somente as cores dentro da faixa permanecem na imagem. Aplicando o filtro
morfolgico e componente conectado, so encontradas as regies equivalentes a cada objeto e
suas informaes so armazenadas. Com as informaes de posio, de cor do objeto, verifica-se
a profundidade mdia da rea central da regio do objeto na imagem de profundidade. Com as
informaes tanto de sombra e objeto quanto de objetos a prxima etapa determinar os pares
e a relao entre eles. Vamos comear pelo algoritmo que analisa a correspondncia entre a
sombra e o objeto.
4.5.5 Algoritmo de anlise de correspondncia

Depois de encontrar o objeto e a sombra na imagem, importante determinar os pares
corretamente. Por isso procuramos utilizar uma soluo que apresentasse uma base apoiada
em um formalismo terico. Na seo 2.2.3.2 foi sugerida uma soluo para o problema de
correspondncia baseada no PQRS, a qual diz que: sombra do objeto aquela que est ligada
base deste objeto, com a fonte de luz mais prxima do objeto do que da sombra, e tanto objeto
quanto pelo menos parte da sombra estejam sobre a mesma superfcie. O algoritmo 8 representa
o pseudocdigo utilizado para correspondncia.
Figura 55: Exemplo de sequncia da segmentao de um quadro na deteco ROI:(a) canal V, (b) canal V aps
limiar acima , (c) filtro morfolgico, (d) retngulo verde indica regies candidatas a regio de interesse (ROI), (e)
canal S aps filtro passa-alta sat , (f) mscara ROI.
(a) (b)
(c) (d)
(e) (f)
Fonte: autor.
O Algoritmo 8 serve para mais de um objeto e sombra em cena, e funciona do seguinte

modo: com os dados armazenados pelo algoritmo de reconhecimento de sombra e de objeto
(Algoritmo 5), o sistema verifica se h conexo externa entre cada sombra e a base de todos os
objetos (Algoritmo 9). Em caso de haver uma conexo, analisamos se fonte de luz est mais
prxima do objeto do que da sombra. As informaes de conexes sero armazenadas para
serem utilizadas como uma das caractersticas para determinar o tipo de relao entre a sombra e
o objeto.
Na Figura 56 encontramos um exemplo de como verificada a conexo externa das
sombras com a base dos objetos utilizando detectores de borda (seo 2.7.4). Na Figura 56a
existem dois objetos e consequentemente duas sombras na imagem, note que o objeto em forma
de cone tem duas sombras conectadas externamente a ele. As Figuras 56c e 56e mostram que as
conexes entre as duas sombras e o cone foram detectadas, contudo somente uma das sombras
est mais distante da fonte de luz do que o cone. Em alguns casos, a sombra na imagem no
Algorithm 8 Anlise de Correspondncia (Dados)

1: Declarao de Variveis: Booleano Conectado
2: for all objeto do
3: while sombras[j] do
4: Conectado CON ECT IV IDADE(objeto[i], sombra[j]);
5: if Conectado = True then
6: sombra conectada ao objeto[i] sombra[j];
7: objeto conectado sombra[j] objeto[i];
8: incrementa informao de total de conectado[i];
9: incrementa j;
10: end if
11: end while
12: incrementa i;
13: end for
14: while objeto[i] do
15: if total de conectado=1 then
16: if Conectado com base = True then
17: while sombras[j] do
18: sombra correspondente do objeto[i] sombra[j];
19: correspondncia true;
20: end while
21: end if
22: else
23: if total de conectado > 1 then
24: lista de proximidade, dvida objeto[i];
25: while lista dvida do
26: if objeto mais prximo da luz do que sombra then
27: sombra correspondente do objeto[i] sombra[j];
28: end if
29: end while
30: end if
31: end if
32: end while
se conecta a nenhuma base dos objetos em cena. Esses casos so casos especiais, tais como
sombras provocadas por um objeto que esteja fora da cena ou oculto por outro objeto. Os casos
de ocluso e de objeto com duas sombras no ocorrem nos experimentos relatados neste trabalho,
pois utilizamos somente um nico objeto alvo em cena.
Toda a sombra e objeto que so correspondentes entre eles formam o par objeto-sombra,
e algumas informaes sobre o par tambm so armazenadas, tal como a posio relativa entre
os retngulos que definem a sombra e o objeto. As informaes coletadas sero utilizadas para
definir as relaes entre o objeto e a sobra. Essas relaes so as evidncias utilizadas para auto
localizao do rob, como descrito na seo 4.5.1. A seguir o algoritmo que infere a relao
entre pares de objetos.
Figura 56: Imagem exemplo de busca de regies externamente conectadas, para cada sombra todas as bases de
objetos so verificadas onde as bordas se encontram intensidade aumenta e EC verdade.
(a)
(b) (c)
(d) (e)
Fonte: autor.
Algorithm 9 CON ECT IV IDADE(Regiao1, Regiao2)

1: Imagem 1 contorno Regio1 100;
2: Imagem 2 contorno Regio2 100;
3: Imagem Conectado Soma(Imagem 1, Imagem 2);
4: Imagem Conectado contorno - 100;
5: if Conta (pixel 6= zero) > zero then
6: return True;
7: else
8: return False;
9: end if
4.5.6 Algoritmo de reconhecimento de relaes espaciais
A partir das informaes dos objetos podemos acrescentar outras e descobrir o tipo de
relao entre pares de objetos. Para cada par verificado quais das relaes de direo (posio
e profundidade) e relaes topolgicas (ocluso) so percebidas. Para determinar se o par tem
uma relao Right ou Lef t compara-se a posio dos objetos relativa ao eixo x da imagem
(Figura 36). Para determinar se o par tem uma relao F ront ou Behind compara-se a distncia
de ambos os objetos em relao ao rob. Utilizamos principalmente as informaes da imagem
de profundidade do sensor Kinect, quando no possvel obter a leitura deste sensor utilizamos
as localizaes dos objetos em cena relativas ao eixo y (Figura 36).
Para determinar a conexo entre os objetos, assim como no problema objeto e sombra
(seo 4.5.5), as bordas so somadas em uma imagem e depois subtradas permanecendo somente
aqueles pixels onde as bordas se sobrepuseram (Figura 57). Todos os pixels que sobram so
contados, caracterizando a conexo entre objetos, a Figura 57h mostra a conexo que ocorre na
Figura 57f. Quando os objetos esto prximos, mas ainda no esto conectados, alguns pontos
de conexo comeam a aparecer. Essa uma caracterstica que pode indicar movimento, outra
caracterstica a distncia entre o par, ou seja, quando dois objetos se aproximam ou se afastam
entre si na sequncia de imagens.
As informaes de conexo, distncia e profundidade so parme-
tros utilizados para determinar se os objetos esto parcialmente sobrepostos
(P artiallyOccludesP O ou P artiallyOccludesP O1 ). Utilizamos uma varivel para indicar a
condio de ocluso (ocluindo) (algoritmo 7), nas cenas em que somente um objeto aparece, caso
o par desse objeto esteja na condio de ocluso, infere-se que o objeto invisvel est totalmente
ocluso por aquele objeto em cena (T otallyOccludesN T P P ou T otallyOccludesN T P P I).
Finalmente, quando entre os objetos no existe conexo e o par est livre de ocluso a relao
percebida a N onOccludesDC. Neste experimento as relaes percebidas so informaes
para definir a localizao. Quanto mais informaes menor ser o nmero de evidncia retornada
para o algoritmo 3 que ser utilizada na etapa de atualizao de informao (linha 3 algoritmo 3)
do algoritmo de auto localizao.
Algorithm 10 Relaes espaciais (Scene)

1: for all todos os pares (A, B) do
2: if A.x < B.x then
3: Lef t(A, B)
4: else
5: Right(A, B)
6: end if
7: if A est mais prximo do rob que B then
8: F ront(A, B)
9: else
10: if B est mais prximo do rob que A then
11: Behind(A, B)
12: end if
13: end if
14: if CON ECT IV IDADE(A, B) = True then
15: ocluindo T rue
16: if F ront(A, B) then
17: P artiallyOccludesP O(A, B)
18: else
19: if Behind(A, B) then
20: P artiallyOccludesP O1 (A, B)
21: end if
22: end if
23: else
24: if ocluindo = T rue then
25: if F ront(A, B) then
26: T otallyOccludesN T P P (A, B)
27: else
28: if Behind(A, B) then
29: T otallyOccludesN T P P I(A, B)
30: end if
31: end if
32: N onOccludesDC(A, B)
33: ocluindo F alse
34: end if
35: end if
36: end for
Neste captulo mostramos um mtodo de raciocnio espacial qualitativo probabilstico

para a interpretao espacial do ambiente tridimensional a partir de imagens bidimensionais
para aplicar em um rob mvel em ambiente real na execuo da tarefa de auto localizao. No
prximo captulo faremos experimentos com esse mtodo utilizando dados reais de um rob
mvel.
Figura 57: Imagem exemplo para definio de relaes topolgica de ocluso.

(a) (b)
(c) (d)
(e) (f)
(g) (h)
Fonte: adaptado de Santos et al. (2010) e Fenelon et al. (2010).

139
5 EXPERIMENTOS EM RACIOCNIO
ESPACIAL QUALITATIVO PROBABI-
LSTICO PARA AUTO LOCALIZA-
O DO ROB MVEL
Neste captulo descreveremos os procedimentos adotados para execuo dos experimen-

tos relativos localizao do rob. Os resultados obtidos com PQRS probabilstico e com REQ
probabilstico esto relatados nas sees 5.2 e 5.4. Como os resultados foram avaliados est
descrito na seo 5.3.
5.1 Descrio dos Ambientes de Testes

Em ambos os casos o ambiente foi preparado para que o rob tivesse uma rea de atuao
livre para navegao. No primeiro ambiente o objeto foi disposto de modo a garantir que o
mesmo estivesse a vista do observador sem obstruo por parte de qualquer outro elemento.
Enquanto que no segundo ambiente as caixas foram dispostas de forma que o rob pudesse
navegar entre elas (Figura 60). Em ambos os casos o rob P eopleBotT M capturou imagens
enquanto navegava pelo ambiente. Os sistemas de auto localizao foram desenvolvidos em
computadores com ambiente de desenvolvimento Visual Studio 2010 instalado. Para o sistema de
viso computacional foi utilizada a biblioteca Open Source Computer Vision (OpenCV), baseada
na plataforma C++.
5.1.1 Descrio do ambiente de teste com objeto-sombra

As imagens foram capturadas em um laboratrio (Figura 58). Neste ambiente interno
existem alguns mveis de escritrio, piso opaco e claro, uma fonte de luz predominante, e um
objeto cilndrico preto. O objeto que causa a sombra tem forma geomtrica bem definida e
contnua (sem buracos), alm da cor escura que serve para distinguir o plano de fundo do objeto
e sombra. Para ter uma sombra bem definida, utilizamos uma luminria em trip com lmpada
halgena de 1000 Watts. Com essa configurao, a fonte de luz pode ser colocada em posies
distintas. Entretanto, para garantir um ambiente cognitivamente relevante (MAMASSIAN;
GOUTCHER, 2001) mantivemos a fonte de luz sempre acima do objeto e do observador. A
distncia entre a fonte de luz e o objeto define o raio do crculo e a forma da rea de atuao.
Captulo 5. EXPERIMENTOS EM RACIOCNIO ESPACIAL QUALITATIVO PROBABILSTICO PARA AUTO
140 LOCALIZAO DO ROB MVEL
Figura 58: O ambiente utilizado para a coleta de imagens com sombra.
Fonte: Santos, Dee e Fenelon (2008).
No papel de observador utilizamos um rob mvel ActivMedia P eopleBotT M com

processador Pentium III, 512 MB de memria, velocidade de 533 Hz, com uma cmera acoplada,
com a qual as imagens foram capturadas. O rob foi programado e teleoperado utilizando
a biblioteca de controle ActivMedia Robotics Interface for Applications (ARIA). Barbantes
esticados no cho serviram para a demarcao das regies fisicamente.
5.1.2 Descrio do ambiente de teste com mltiplos objetos

O ambiente interno, utilizado nos experimentos reportados a seguir, um espao entre as
salas existentes no quinto andar do prdio K do Centro Universitrio da FEI (Figura 60). So
utilizadas trs caixas coloridas, cada caixa tem cor nica (vermelho ou verde ou azul). Para
demarcar as regies (para fins de comparao com a resposta automtica do sistema) utilizamos
barbantes, os quais representam as linhas de viso fisicamente.
Para capturar imagens foi utilizado um Kinect disposto sobre um rob mvel ActivMedia
P eopleBotT M . Ambos foram controlados por um algoritmo de controle e captura instalado em
um notebook com o Robot Operating System (ROS). Todos os testes foram realizados off-line
utilizando as imagens coletadas conforme procedimento descrito a seguir.
5.1.3 Procedimentos de coleta de imagens com sombra-objeto

Em ambiente de teste preparado conforme descrito na seo 5.1.1, o rob foi colocado
em uma regio dentro da rea de atuao na qual o objeto e sombra estavam dentro do seu campo
5.1. Descrio dos Ambientes de Testes 141
visual. Isso porque importante que a primeira imagem tenha objeto e sombra por completo,
pois essa imagem ser utilizada em uma calibrao manual do limiar para segmentao. Depois
que se inicia o algoritmo de captura e controle do rob, o operador tem autonomia para parar de
salvar os frames capturados, assim como marcar em qual a regio o rob esta localizado durante
a captura da imagem. Deste modo, para evitar erro na anotao, as imagens deixavam de serem
salvas quando o rob passava de uma regio para a outra, o que garantiu uma anotao correta
da regio em que a imagem foi capturada. Para cada imagem salva os dados relacionados a essa
imagens tais como: o nome da imagem, a regio real, a velocidade e posio relativa ao inicio de
cada coleta so armazenados em arquivo.
Esse conjunto de imagens foi utilizado para o experimento de auto localizao e auto
calibrao e por esse motivo foi mantida a sequncia de captura. Por limitaes do rob, a captura
foi realizada em dias e horrios diferentes, recomeando a captura sempre do ponto que finalizou
a sequncia anterior. Deste modo a sequncia de transio espacial foi mantida. O rob capturou
587 imagens passando por todas as regies pelo menos uma vez. Contudo, em aproximadamente
33% das imagens no foi possvel manter por completo o objeto e a sombra dentro do campo de
viso do rob (Figura 59).
Todas as 587 imagens RGB com resoluo de 640 x 480 e os dados em arquivo, foram
utilizados para fazer os experimentos off-line. Alm desse conjunto em sequncia, havia em
arquivos outras imagens de capturas anteriores, as quais estavam separadas por regio onde
foram capturadas, algumas dessas imagens foram utilizadas para criar o modelo de imagem. Na
prxima seo vamos descrever o algoritmo de auto localizao e auto calibrao.
5.1.4 Procedimento de coleta de imagens com mltiplos objetos
Depois de preparar o ambiente (seo 5.1.2), o rob P eopleBotT M foi remotamente con-
trolado para navegar por todas as 28 regies. A posio inicial aquela escolhida pelo operador
que controla o rob navegando pelo ambiente entres as caixas salvando imagens RGB e imagens
binrias de profundidade e os dados de hodometria. Para este experimento somente as imagens
RGB e de profundidade capturadas com o sensor Kinect foram utilizadas. Esse procedimento
semelhante ao procedimento realizado no ambiente com sombra 5.1.1, porm no foi possvel
anotar as regies onde o rob estava passando durante o experimento. Tambm no necessria a
calibrao dos parmetros de viso. Em duas coletas foram capturadas aproximadamente 18000
frames formando dois conjuntos de sequncias de imagens com resoluo de 640 x 480.
Em cada coleta foram executadas aproximadamente trs voltas pelo ambiente alterando o
circuito, porm procurando manter os objetos no campo visual do rob. O primeiro conjunto com
9033 imagens foi utilizado para criar o modelo de imagem (seo 5.1.6), enquanto que o segundo
com 9483 imagens foi utilizado no experimento off-line de auto localizao. Considerando o
nmero de objetos que aparecem em cena, os dois conjuntos de imagens juntos tm 9% de
Figura 59: Imagens em que o objeto e a sombra no esto completamente dentro do campo de viso do rob. O
sistema somente com raciocnio espacial no poderia inferir uma localizao a partir dessas imagens.
(a) (b)
(c) (d)
Fonte: autor.
Figura 60: Ambiente utilizado para captura e auto-localizao com mltiplos objetos.
Fonte: autor.
5.1. Descrio dos Ambientes de Testes 143
Figura 61: Imagens capturadas com trs pares, um par e nenhum par em cena
(a) (b) (c) (d)
Fonte: autor. .
imagens com trs objetos, 42% com dois objetos, e com um ou nenhum objetos 45% e 5%
respectivamente.
Neste procedimento no foram salvas as informaes de localizao real enquanto o
rob capturava a imagem. Por isso a tabela (gold standard) que ser utilizada para comparar a
resposta do sistema foi elaborada manualmente. Cada imagem foi analisada pelo especialista
que anotou os dados da regio onde o rob estava localizado, quais objetos visveis em cena,
alm das relaes espaciais entre os pares. Para isso contou com a ajuda das informaes do
ambiente em cena e do barbante, o qual foi o principal parmetro utilizado para reconhecer em
qual regio o rob estava localizado no momento da captura do frame. Distinguir uma regio
de outra foi possvel utilizando a ocluso do barbante pela caixa. O conjunto que foi utilizado
no experimento de auto localizao composto por 12% de imagens com trs pares, 46% de
imagens com um par, e 42% de imagens sem pares, destas imagens ou h somente uma caixa
(39%) ou nenhuma (3%) presente em cena. A Figura 61 tem um exemplo para cada caso. Com
as imagens coletadas e antes de colocar o sistema para inferir localizao, fizemos o modelo de
imagens para cada um dos domnios.
5.1.5 Modelo de imagens para sombra-objeto

Com imagens capturadas pelo P eopleBotT M de todas as regies:
Escolhemos somente imagens nas quais tanto o objeto quanto a sombra estavam completa-
mente em cena. Este conjunto garante que existe sempre objeto-sombra para ser avaliado
pelo sistema de viso.
Todas as imagens separadas por regio foram analisadas pelo algoritmo 2, para cada valor
de limiar. Este algoritmo o responsvel por determinar qual o tipo de relao espacial
qualitativa percebida entre o objeto e a sombra.
O conjunto de imagens utilizadas para o modelo no est em sequncia e pode apresentar

diferenas de luminosidade por ter sido capturado em dias, horrios diferentes, inclusive a
posio da luz e do objeto dentro da sala no so sempre os mesmos. Esse conjunto foi montado
com imagens de um banco de imagens capturadas anteriormente, ou seja, no so as mesmas

imagens utilizadas para o experimento de auto localizao e calibrao.
5.1.6 Modelo de imagem com mltiplos objetos

Uma forma de construir o modelo de imagem separar um banco de imagens de cada
regio. Essas imagens devem conter pelo menos um par de objetos em cena, inclusive quando
existe a ocluso. Pelas frmulas (4.21) at (4.48) a localizao em cada regio est relacionada a
uma combinao de relaes entre pares percebveis por um observador que esteja nesta regio.
Com o banco de imagens verificamos para cada imagem a frequncia com que as combinaes
de relaes aparecem para cada regio. No banco de imagens utilizado as regies, R9, R15, R18,
R27, R28 todas as imagens tm somente um ou nenhum objeto em cena, consequentemente
nenhum par para extrair a relao pela imagem. Ento uma opo foi definir os valores de
probabilidade por aproximao.
Usamos os dados de uma sequncia de imagens e a regio na qual essas imagens foram
capturadas (seo 5.1.4). Contamos o nmero de respostas de regies do algoritmo de localizao
(Algoritmo 4) para cada regio do mapa (Figura 46). Assim as evidncias et so as regies na
qual as relaes do sistema de viso podem ser percebidas. Um rob est em qualquer uma das
regies quando captura a imagem e isto uma verdade. Deste modo, por exemplo, se em uma
dada imagem quatro evidncias apresentam a mesma possibilidade de ser a regio em que o rob
est localizado pelo algoritmo 4, por uma aproximao ento cada uma recebe o valor de 0, 25,
enquanto que as outras evidncias recebem zero. Todos os valores so somados por evidncia e
depois normalizados por regio. Este o modelo de imagem utilizado neste experimento.
5.1.7 Teste com o sistema de auto localizao

O sistema composto pelos algoritmos relatados no captulo 4.5 foi codificado em C++
e para as tcnicas de viso computacional utilizamos a biblioteca OpenCV 1 . Com o banco de
imagens, os dados sobre essas imagens, o modelo de imagem e o modelo de transio rodamos
os experimentos de auto localizao de modo off-line. Em nossos experimentos um rob mvel
Pioneer P eopleBotT M coletou fotos em um ambiente interno (Figura 58). O rob foi tele operado
e poderia comear em qualquer uma das regies indicadas na Figura 47. Com os algoritmos
descritos na seo 5.1.7 o sistema utiliza a crena sobre a localizao do rob e o que percebido
a partir da imagem do cenrio, fornecendo o estado do rob e alterando o parmetro de limiar do
sistema de viso. O sistema de viso converte as imagens digitais capturadas pela cmera do rob
mvel para o espao de cores HSV, e a deteco do objeto e da sombra utiliza principalmente
um filtro de limiar no canal de intensidade luminosa V .
1
Open Source Computer Vision - http://opencv.org/-ltimoacesso06/02/2014
5.2. Mtodo de Avaliao 145
Figura 62: Representao de um rob na regio 3.
Fonte: autor.
5.2 Mtodo de Avaliao

Para avaliar o sistema foi analisada a sua acurcia. Para definir uma auto localizao como
correta comparou-se a resposta do sistema com uma base de conhecimento verdadeiro (gold
standard). A base de conhecimento quando utilizando as informaes de ocluso de sombras
foram marcadas durante a captura das imagens, enquanto para o ambiente com mltiplas caixas
essa tabela foi criada manualmente por um especialista. A acurcia a proporo de resultados
corretos, dentre todos os resultados e dada pela frmula (5.1):
resultados corretos
acia =
acur (5.1)
todos resultados
Esse tipo de anlise foi utilizada em ambos os experimentos de auto localizao. Os

resultados foram avaliados tanto para verificar a acurcia por regio quanto acurcia do sistema
todo. Por exemplo, todas as imagens que o rob capturou enquanto estava na regio 3 (Figura 62),
so consideradas como resultado correto quando o sistema retorna a regio 3, e incorreto quando
retorna qualquer outra regio. Em ambos os casos comparamos os resultados do sistema com
extenso probabilstica com o sistema utilizando somente o raciocnio espacial qualitativo. Os
resultados para ambos os testes esto descritos nas sees 5.3 e 5.4.
5.3 Resultados para Auto Calibrao e Auto Localizao

com Sombras
O sistema PQRS probabilstico foi aplicado em uma sequncia de 587 imagens. As
imagens foram capturadas em um ambiente interno contendo um objeto com sombra (seo 5.1.1).
O resultado do procedimento de localizao (no mapa mostrado na Figura 47) est apresentado
na matriz de confuso na Tabela 14. Cada coluna representa a resposta do sistema, enquanto que
Tabela 14: O resultado do experimento de auto localizao utilizando um filtro Bayesiano e o Raciocnio
Qualitativo Perceptual sobre Sombras.
Regies Region1 Region2 Region3 Region4
Region1 97% 3% 0% 0%
Region2 25% 74% 1% 0%
Region3 9% 21% 66% 4%
Region4 6% 0% 8% 86%
Region5 0% 0% 35% 65%
as linhas representam a regio na qual o rob estava (de acordo com a tabela de referncia gold
standard).
A Tabela 14 tem os valores de resposta do sistema PQRS probabilstico em porcentagem
para cada regio onde as imagens foram capturadas. Na regio Region1 o sistema apresentou uma
acurcia de 97% e os 3% restantes o sistema deu como resposta a regio vizinha Region2 . Em
Region2 o sistema obteve uma acurcia de 74%, os 26% restantes o sistema deu como resposta
uma das regies vizinhas Region1 e Region3 em um total de 25% e 1% respectivamente. J para
a regio Region3 a acurcia foi de 66%, sendo que achou estar localizado nas vizinhas Region2
e Region4 em 21% e 4% das imagens respectivamente, em 9% das imagens deu como resposta
a Region1 . Para a Region4 a acurcia do sistema foi de 86%, com sistema se localizando na
vizinha Region3 em 8% e na regio Region1 em 6%. A acurcia do sistema na regio Region5
no existe j que esta regio no foi avaliada por este sistema (que utiliza a relao objeto-sombra
visveis na imagem), como localizao apresentou 65% na vizinha Region4 e 35% na regio
Region3 .
A Tabela 15 compara os resultados obtidos utilizando o PQRS com uma base de conhe-
cimento com aqueles obtidos com o aqui proposto PQRS probabilstico. O sistema PQRS com
uma base de conhecimento tem a informao da regio na qual o rob est localizado e procura
um limiar que confirme essa informao para esta localizao, ou para as vizinhas (FENELON
et al., 2012).
Na Tabela 15, a linha refere-se localizao real de cada imagem (regies Region1
at Region5 ). A coluna #imagens representa a quantidade de imagens capturadas por regio.
Enquanto que a coluna "#inf completa" apresenta a porcentagem de imagens na qual a sombra e
o objeto esto completamente dentro da imagem. Para compor os valores dessa coluna ficaram
de fora: imagens sem sombra ou objetos; imagens s com sombras, imagens nas quais a sombra
ou o objeto esto encostados em uma das laterais da imagem. Os resultados de acurcia obtidos
com PQRS esto representados na coluna "baseado no conhecimento. Os resultados da coluna
"baseado na crena so referentes aos resultados de acurcia obtidos com PQRS probabilstico.
5.3. Resultados para Auto Calibrao e Auto Localizao com Sombras 147
Tabela 15: Valores de acurcia do algoritmo baseado em conhecimento e o com o filtro Bayesiana qualitativo,
onde # imagens o nmero de imagens capturadas em cada regio.
baseado no baseado
Regies # imagens #inf completa (%) conhecimento (%) na crena (%)
Region1 225 54 66 97
Region2 171 65 34 74
Region3 138 77 80 66
Region4 36 92 44 86
Region5 17 94 59 0
Global 587 67 58 80
Como exemplo, a ltima linha mostra que para 587 onde 67% tinham informao completa na
imagem o desempenho foi de 58% com PQRS para 80% de acurcia com o PQRS probabilstico.
O sistema PQRS consegue lidar com algum grau de incerteza, na Tabela 15 podemos ver
o reflexo disso nas linhas referentes s regies Region1 e Region3 onde o sistema obteve uma
porcentagem de acerto maior que o nmero de imagens com informao completa. Ainda assim,
com exceo da regio Region3 o sistema PQRS probabilstico apresentou desempenho superior
e em presena de incerteza em todas as regies. A Tabela 14 mostra que o maior nmero de
falsos negativos para a Region3 foi relatado com o rob localizado na regio 2 (21% dos casos),
parte deste erro devido ao problema de fronteira.
Na fronteira entre duas regies o nmero de caractersticas que indica a relao entre
objeto-sombra igual para ambos os locais. O problema de fronteira ocorre porque ao escolher
qual a relao espacial (evidncia) com mxima probabilidade somente aquela na qual o valor
foi analisado primeiro passa como evidncia para o filtro Bayesiano. Esta escolha teve reflexos
positivos nas regies Region1 , Region2 e Region4 , entretanto na Regio Region3 a acurcia
decaiu em comparao com experimentos anteriores.
A regio Region5 um caso a parte j que para estes experimentos optamos por codificar
o sistema sem mecanismo para inferir esta regio. Isso devido ao modelo de movimento, no qual
a relao de ocluso total (Totally Occludes) no foi considerada na composio da funo w, j
que esta funo calculada com a existncia de sombras. Como a rea dessa regio pequena, o
efeito negativo sobre o desempenho global foi de aproximadamente 2, 8%.
O desempenho global deste experimento apresentou uma elevao da acurcia passando
de 58% no PQRS para 80% no PQRS probabilstico. Os resultados com o sistema PQRS
probabilsticos foram animadores, contudo os testes de auto localizao foram realizados somente
com um objeto (mapa Figura 47). Com mais de um objeto o mapa tem mais regies formadas
pela sobreposio de regies. Os testes com mltiplas caixas serviram tambm para mostrar a
adaptabilidade do mtodo considerando relaes entre os elementos diferentes de sombra. Na
prxima seo (seo 5.4) os resultados relativos aos experimentos de auto localizao com REQ
probabilstico.
5.4 Resultados para Auto Localizao com Mltiplos Obje-

tos
O sistema REQ probabilstico foi aplicado em uma sequncia de 9483 imagens. As
imagens foram capturadas em um ambiente interno contendo trs objetos como marcos (seo
5.1.2). O resultado do procedimento de localizao (no mapa mostrado na Figura 46) est
apresentado na matriz de confuso na Tabela 16. Na primeira coluna esto as regies de R1
at R28. Todas as demais colunas representam as respostas do sistema, enquanto que as linhas
representam a regio na qual o rob estava (de acordo com a tabela de referncia gold standard).
A Tabela 16 tem os valores de resposta do sistema REQ probabilstico em porcentagem
para cada regio onde as imagens foram capturadas. Na diagonal desta tabela esto representados
os valores de acurcia, com acurcia acima de 90% as regies R2, R3, R4, R6, R9, R10, R11,
R12, R13, R15, R16, R22, R21, R24, R25, com acurcia entre 70% e 90% as regies R1, R5,
R7, R14, R19, R20, R23, e com acurcia menor que 70% as regies R8, R17, R18, R26, R27,
R28. As regies R1, R2, R3, R9, R10, R11, R12, R13, R14, R15, R16, R24, R22, R25 so casos
nos quais ou o sistema respondeu como localizao a prpria regio, ou deu como resposta uma
regio vizinha.
A Tabela 17 refere-se aos resultados de acurcia dos sistemas de auto localizao
relativos ao mapa qualitativo da Figura 46. Com essa tabela podemos comparar os resultados dos
sistemas baseados em raciocnio espacial com e sem a extenso probabilstica. A primeira coluna
(#objetos) refere-se ao nmero de objetos alvos visveis na imagem: nenhum (0), somente um
(1), um par (2), trs pares (3) e na ltima linha o total de imagens utilizadas neste experimento.
Na quarta coluna (# imagens) os valores representam a quantidade de imagens coletas com
o nmero de objetos alvos visveis indicados na primeira coluna. Os valores apresentados
na segunda e na terceira colunas so referentes s imagens com as quais o sistema retornou
corretamente a localizao do rob, na segunda coluna (REQ) esto as respostas do sistema
utilizando somente o raciocnio espacial qualitativo para inferncia, enquanto que na terceira
coluna (REQ probabilstico) esto s respostas do sistema utilizando o raciocnio espacial
qualitativo com um filtro Bayesiano. Nas duas ltimas colunas (%REQ, %REQ probabilstico)
esto os valores de acurcia representados em porcentagem para cada abordagem.
Pela Tabela 17, a primeira linha mostra que de 299 imagens sem nenhum objeto somente
o sistema PQRS probabilstico acertou em uma nica imagem a localizao do rob. A ltima
linha mostra que no total de 9483 imagens os totais com resposta de localizao correta foram
Tabela 16: Matriz de confuso com os resultados do experimento de auto localizao utilizando REQ probabilstico. As linhas so as regies onde a imagem foi capturada e as
colunas a resposta do sistema.
R1 R2 R3 R4 R5 R6 R7 R8 R9 R10 R11 R12 R13 R14 R15 R16 R17 R18 R19 R20 R21 R22 R23 R24 R25 R26 R27 R28
R1 0,839 0,054 0,107
R2 0,991 0,009
R3 0,007 0,971 0,022
R4 0,024 0,003 0,969 0,003
R5 0,208 0,703 0,089
R6 0,984 0,016
R7 0,207 0,034 0,736 0,011 0,011
R8 0,089 0,002 0,391 0,354 0,053 0,015 0,075 0,021
R9 1,000
R10 0,922 0,078
R11 0,992 0,008
R12 0,044 0,956
R13 0,021 0,925 0,054
R14 0,833 0,167
5.4. Resultados para Auto Localizao com Mltiplos Objetos
R15 1,000
R16 0,068 0,932
R17 0,129 0,002 0,530 0,099 0,001 0,001 0,004 0,221 0,013
R18 0,676 0,226 0,098
R19 0,087 0,739 0,109 0,043 0,022
R20 0,008 0,004 0,133 0,760 0,004 0,087 0,004
R21 0,971 0,029
R22 0,019 0,923 0,058
R23 0,054 0,018 0,875 0,054
R24 0,024 0,913 0,004 0,028 0,032
R25 1,000
R26 0,003 0,101 0,236 0,002 0,634 0,026
R27 0,016 0,690 0,284 0,002 0,008
R28 0,860 0,103 0,009 0,028
Fonte: autor.
149
Tabela 17: Tabela com os valores de acurcia do sistema REQ probabilstico.
#objetos REQ REQ probabilstico #imagens %REQ %REQ probabilstico

0 0 1 299 0,0% 0,3%
1 440 817 3867 11,4% 21,1%
2 3670 3727 4228 86,8% 88,2%
3 970 978 1089 89,7% 89,8%
total 5087 5523 9483 53,6% 58,2%
Fonte: autor.
53,6% (5087) para o sistema utilizando somente o raciocnio espacial para inferncia e 58%
(5523) para o REQ com o filtro Bayesiano. As outras linhas da Tabela 17 so anlogas para
imagens com um, dois ou trs objetos.
A Tabela 18 tem os valores de acurcia detalhados por regio, as linhas tm informaes
sobre as regies especificadas na primeira coluna (Regies). A segunda coluna (#images)
referente ao total de imagens capturas em cada regio, enquanto que as quatro colunas seguintes
so referentes ao total de imagens pelo nmero de objetos visveis (#objetos na imagem). As
stima (REQ) e oitava (PREQ) colunas representam o total de vezes que os sistemas acertaram a
localizao, estes valores de acurcia tm sua representao em porcentagem nas nona (%REQ)
e dcima (%PREQ) colunas. Por exemplo na regio R18 foram capturadas 509 imagens todas
com um nico objeto e somente o REQ probabilstico conseguiu inferir corretamente em 22,6%
(115) das imagens.
A Tabela 19 refere-se somente as regies na qual ocorre ocluso e as imagens em que
somente um objeto aparece na imagem. A coluna regies so as regies onde ocorre a relao de
ocluso total entre um dos pares (T otallyOccludesN T P P, T otallyOccludesN T P P I 1 ). A
segunda coluna (#imagens com 1 objeto) tem os totais de imagens capturadas nessas regies em
que somente uma caixa aparece na imagem contudo existem duas caixas em cena. A coluna REQ
apresenta o total de vezes em que o sistema REQ acertou a localizao. Por fim, a ltima coluna
(PREQ) apresenta o total de vezes em que o sistema REQ probabilstico acertou a localizao do
rob. Como exemplo a ltima linha mostra que de 515 imagens em regio de ocluso total com
somente um objeto em 440 e 457 vezes a localizao foi inferida corretamente pelos sistemas
REQ sem e com filtro Bayesiano respectivamente.
Vamos fazer outra analise agora no que se refere localizao em regies prximas,
como uma resposta qualitativa caso uma regio prxima seja dada essa deve ser considerada. Na
matriz de confuso (Tabela 16) notem que em grande parte as respostas para a regio e vizinhas
ocorrem, por exemplo, considerando a vizinhana na regio R1 o sistema teria acertado em
todas as respostas. Mas vamos analisar considerando tambm o percurso, no caso em que o rob
tem como resposta uma regio que alm de vizinha aquela para a qual estava se deslocando.
A Tabela 20 mostra uma comparao de acurcia por regio, na ltima coluna (%PREQ Viz.)
representa os valores para o REQ probabilstico considerando esse percurso e a vizinhana, a
5.4. Resultados para Auto Localizao com Mltiplos Objetos 151
Tabela 18: Tabela com os valores de acurcia do sistema detalhado por regio.
#objetos na imagem
Regies #images 0 1 2 3 REQ PREQ %REQ %PREQ
R1 112 0 3 78 31 96 94 85,7% 83,9%
R2 115 0 55 60 0 115 114 100,0% 99,1%
R3 415 0 3 346 66 399 403 96,1% 97,1%
R4 290 0 0 46 244 281 281 96,9% 96,9%
R5 101 0 9 87 5 71 71 70,3% 70,3%
R6 64 0 64 0 0 46 63 71,9% 98,4%
R7 87 0 7 80 0 61 64 70,1% 73,6%
R8 1452 0 661 698 93 557 568 38,4% 39,1%
R9 194 1 193 0 0 0 194 0,0% 100,0%
R10 102 0 4 71 27 94 94 92,2% 92,2%
R11 124 0 50 74 0 124 123 100,0% 99,2%
R12 91 0 3 30 58 84 87 92,3% 95,6%
R13 240 0 0 105 135 220 222 91,7% 92,5%
R14 54 0 7 31 16 45 45 83,3% 83,3%
R15 162 0 148 14 0 162 162 100,0% 100,0%
R16 44 0 7 37 0 37 41 84,1% 93,2%
R17 1651 0 577 986 88 859 875 52,0% 53,0%
R18 509 0 509 0 0 0 115 0,0% 22,6%
R19 46 0 1 15 30 34 34 73,9% 73,9%
R20 263 0 103 160 0 201 200 76,4% 76,0%
R21 34 0 0 4 30 29 33 85,3% 97,1%
R22 52 0 0 0 52 48 48 92,3% 92,3%
R23 56 0 3 5 48 49 49 87,5% 87,5%
R24 252 0 95 157 0 231 230 91,7% 91,3%
R25 64 0 2 32 30 61 64 95,3% 100,0%
R26 1970 0 725 1109 136 1183 1248 60,1% 63,4%
R27 503 3 497 3 0 0 1 0,0% 0,2%
R28 436 295 141 0 0 0 0 0,0% 0,0%
Global 9483 299 3867 4228 1089 5087 5523 53,6% 58,2%
Fonte: autor.
Tabela 19: Tabela com os resultados de acurcia para o caso especfico das regies onde ocorre ocluso nas quais
somente um objeto aparecem na imagem.
regies #imagens com 1 objeto REQ PREQ

R2 55 55 55
R6 64 46 63
R11 50 50 50
R15 148 148 148
R20 103 66 66
R24 95 75 75
Total 515 440 457
Fonte: autor.
Tabela 20: Resposta de total de imagens com resposta positiva para o REQ e o REQ probabilstico com o REQ
probabilstico considerando as regies vizinhas que estavam no percurso do rob como resposta positiva .
Regies #images REQ PREQ PREQ Viz. %REQ %PREQ %PREQ Viz.
1 112 96 94 110 85,7% 83,9% 98,2%
2 115 115 114 115 100,0% 99,1% 100,0%
3 415 399 403 412 96,1% 97,1% 99,3%
4 290 281 281 283 96,9% 96,9% 97,6%
5 101 71 71 80 70,3% 70,3% 79,2%
6 64 46 63 63 71,9% 98,4% 98,4%
7 87 61 64 66 70,1% 73,6% 75,9%
8 1452 557 568 1159 38,4% 39,1% 79,8%
9 194 0 194 194 0,0% 100,0% 100,0%
10 102 94 94 102 92,2% 92,2% 100,0%
11 124 124 123 124 100,0% 99,2% 100,0%
12 91 84 87 91 92,3% 95,6% 100,0%
13 240 220 222 237 91,7% 92,5% 98,8%
14 54 45 45 54 83,3% 83,3% 100,0%
15 162 162 162 162 100,0% 100,0% 100,0%
16 44 37 41 44 84,1% 93,2% 100,0%
17 1651 859 875 1033 52,0% 53,0% 62,6%
18 509 0 115 115 0,0% 22,6% 22,6%
19 46 34 34 45 73,9% 73,9% 97,8%
20 263 201 200 224 76,4% 76,0% 85,2%
21 34 29 33 33 85,3% 97,1% 97,1%
22 52 48 48 52 92,3% 92,3% 100,0%
23 56 49 49 52 87,5% 87,5% 92,9%
24 252 231 230 231 91,7% 91,3% 91,7%
25 64 61 64 64 95,3% 100,0% 100,0%
26 1970 1183 1248 1294 60,1% 63,4% 65,7%
27 503 0 1 129 0,0% 0,2% 25,6%
28 436 0 0 245 0,0% 0,0% 56,2%
Global 9483 5087 5523 6813 53,6% 58,2% 71,8%
Fonte: autor.
Tabela 21: Comparao que tem os valores de acurcia pelo total de objetos contidos na imagem, considerando a
regio vizinha que estava no percurso executado pelo rob como resposta positiva.
total de imagem REQ REQ probabilstico

por objeto REQ probabilstico vizinhana
0 299 0,0% 0,3% 70,9%
1 3867 11,4% 21,1% 44,1%
2 4228 86,8% 88,2% 90,2%
3 1089 89,7% 89,8% 99,3%
geral 9483 53,6% 58,2% 71,8%
Fonte: autor.
5.5. Discusso 153
coluna PREQ Viz. tem o nmero de imagens com resultado positivo. Os valores para o REQ
e o REQ probabilstico esto nas colunas adjacentes para comparao, essa tabela similar a
Tabela 18. Neste caso o resultado geral representado na ltima linha da Tabela 20 passou de
58, 2% para 71, 8%. Notem que desse modo o desempenho na regio R1 de 98, 2% nem sempre
a regio vizinha aquela na qual o rob est se dirigindo.
Outra tabela para comparao que tem os valores de acurcia pelo total de objetos
contidos na imagem, semelhante Tabela 17 e a Tabela 21, onde na coluna REQ probabilstico
vizinhana esto os valores de acurcia considerando o percurso e a vizinhana. Para o filtro
Bayesiano, a falta de objeto na imagem faz com que todas as regies sejam analisadas, assim o
modelo de transio e a crena posterior (previso) so o que decide qual regio, o que acredito
elevou para um acerto (ou regio do percurso) de 70, 9%, quando com uma caixa, algumas
regies no so analisadas (onde ocorre a ocluso total da caixa que est na imagem), assim
ocorre casos em que a crena em uma regio vizinha diferente daquela que o rob est realmente
se deslocando ocorre, por isso a acurcia ficou em torno de 44, 1%, para as imagens com mais
informaes desempenho foi superior a 90%.
5.5 Discusso
Neste captulo foram apresentados dois sistemas de auto localizao aplicado em sistema
robtico. Esses sistemas executam de modo automtico os algoritmos que executam tarefas
semelhantes como: primeiro reconhecer e extrair as caractersticas dos elementos alvos em
uma imagem; segundo utilizar o raciocnio espacial qualitativo para extrair as relaes entre os
elementos; para em seguida com a formalizao do domnio e com os clculos de raciocnio
espacial inferir informaes a partir das imagens, e utilizar essas informaes como evidncias
em um filtro Bayesiano. A crena com maior valor a resposta do sistema, podendo tambm
atuar na definio de parmetros como foi o caso do sistema de viso para segmentao de
sombras e objetos. O filtro Bayesiano desempenha um papel relevante principalmente na acurcia
das respostas quando as informaes dos sensores foram incompletas ou inexistentes.
O sistema de PQRS probabilstico utilizou o filtro Bayesiano tanto para auto localizao
como para auto calibrao. Quando tratando com sombras, o sistema de viso necessita de uma
calibrao diferente conforme muda de posio no ambiente, elevando o grau de incerteza das
informaes das imagens. Um sistema de calibrao com PQRS precisa saber qual regio onde
est localizado, para encontrar um parmetro de viso que confirme essa informao. Enquanto
que o PQRS probabilstico trabalha com a crena na regio, e tanto a regio quanto o parmetro
que tm maior valor de crena so escolhidos como resposta do sistema. No ambiente com caixas
a incerteza ocorre principalmente devido a informao parcial ou inexistente sobre os pares de
objetos.
Em ambos os experimentos mapas qualitativos foram criados a partir da relao de

ocluso percebida entre elementos. Quando os elementos esto fixos em um ambiente, um
observador em movimento ir notar alteraes na relao espacial entre os elementos do ambiente.
Formalizamos a localizao neste mapa utilizando como base o PQRS (seo 2.2.3) e o ROC
(seo 2.2.2). A auto localizao qualitativa e relativa a elementos que estejam no ambiente.
Existe um conhecimento da disposio qualitativa dos elementos sem informao sobre a posio
exatas deles.
O controle manual no deve interferir na tarefa de auto localizao. A auto localizao
realizada com inferncia a partir dos dados das imagens. Quando a posio relativa ao ponto
de luz e ao objeto, a informao vem da relao sombra-objeto. O rob vai sendo levado de uma
regio a outra e faz a sua localizao pelo que observa. A partir da observao ele vai formando
as suas crenas que podem ser reforadas ou no. Quando o rob tem longa sequncia de tempo
sem informao, a distribuio de crena do filtro vai ficando uniforme por todas as regies.
Quando isso acontece, ele j no consegue identificar corretamente sua localizao. Caso tivesse
autonomia poderia parar e observar em volta do ambiente, isso aumentaria a crena em uma das
regies.
O cdigo atual foi desenvolvido para testar as hipteses sobre a abordagem de raciocnio
espacial qualitativo probabilstico para interpretar imagens de forma mais robusta. O sistema
para mltiplos objetos est em fase de desenvolvimento, os experimentos aqui relatados foram
realizados para verificar se o mtodo de raciocnio espacial qualitativo probabilstico poderia ser
utilizado em ambientes com mais elementos.
A segmentao de sombras e de objetos uma parte essencial quanto ao sucesso da
auto localizao. A viso tem uma grande influncia na localizao, se a segmentao no
conseguir separar o ambiente do objeto e sombra, isso pode corromper a informao utilizada
para determinar as relaes entre objeto e sombra na imagem. Assim, partes das informaes
que sejam alteradas pelos filtros iro alterar os resultados do raciocnio. Nesse trabalho uma
calibrao realizada atravs do software no incio dos testes. A partir dessa calibrao com
um filtro Bayesiano o parmetro de viso responsvel por extrair sombra e objeto da imagem
auto calibrado pelo sistema em tempo de execuo. Para mltiplos objetos a escolha de caixa
coloridas teve como objetivo neutralizar os problemas de viso.
Diferente do desempenho do PQRS probabilstico que teve uma melhora de 20% relativa
ao sistema PQRS, no experimento de auto localizao no mapa da Figura 46 teve uma melhora
de aproximadamente 5%. Esses so resultados de testes preliminares, que foram realizados
com aproximaes dos modelos de filtros Bayesianos para verificar a transferncia do mtodo
utilizado especificamente para informaes espaciais relativas s sombras.
O modelo de imagem aqui utilizado uma aproximao. Um modelo de imagem deve
conter as probabilidades das disjunes de conjunes das relaes de cada par serem percebidas
em cada regio. Procuramos manter o mesmo princpio do modelo de transio do PQRS, no
5.5. Discusso 155
qual o movimento percebido atravs da alterao nas caractersticas percebidas nas imagens,
porm neste experimento perceber o transio atravs da mudana de relao espacial entre pares
foi prejudicada pelo alto nmero de imagens sem pares. A Tabela 18 mostra que em algumas
regies nenhuma imagem foi capturada com pares.
Outro motivo que causa essa diferena, que ao realizar a captura da sequncia de
imagens, nossa ateno foi que o rob passasse por todas as regies sem atentar para o fato
que em algumas no foram mantidos os pares no campo de viso. O filtro Bayesiano fez o que
foi proposto, capacitando o sistema de raciocnio espacial qualitativo a lidar com informaes
parciais. Na Tabela 16 a maior parte dos resultados foi ou a regio ou uma regio prxima
regio que o rob estava localizado. Nas Tabelas 20 e 21 mostram como o filtro fez o trabalho e
com alguns ajuste pode ficar mais eficaz.
As imagens com somente um objeto visvel so as informaes parciais tpicas do
experimento de auto localizao no mapa da Figura 46. Isso porque com exceo dos casos em
que ocorre uma ocluso total em cena, com apenas um objeto um sistema utilizando somente o
REQ no capaz de inferir uma localizao. Com o filtro Bayesiano o sistema pode obter alguns
resultados positivos na auto localizao com informao parcial da imagem. Isso fica evidente
quando comparamos a Tabela 17 na linha referente a um nico objeto na imagem com a ltima
linha da Tabela 19. Os resultados utilizando REQ so os mesmos 440 nas duas tabelas, como
esperado j que o mecanismo de inferncia REQ utiliza relaes espaciais dos pares percebidas
em cenas. O sistema REQ probabilstico acertou a localizao em 817 imagens, das quais 457
so referentes s regies onde uma relao espacial de ocluso total ocorre entre os objetos.
Assim, o REQ probabilstico mesmo com informao parcial foi capaz de inferir corretamente a
localizao em 360 casos.
157
6 CONCLUSO
Os resultados relatados foram animadores pois, alm de demostrarem a possibilidade

de utilizar tcnicas probabilsticas com raciocnio espacial, combinar ambos faz com que os
sistemas tenham uma melhora nas suas respostas.
No captulo 3 comeamos a pesquisa com lgica de descrio probabilstica com clculo
de direo cardinal onde desenvolvemos um mecanismo de inferncia espacial qualitativo com
CRALC para um subdomnio de trfego. Na seo 3.3 propomos duas solues para desenvolver
este mecanismo. Em uma soluo utilizamos o software para criar uma rede Bayesiana auto-
maticamente para as inferncias, formalizando com CRALC os papis referentes as relaes
espaciais implicitamente codificados como conceitos, e a outra soluo a partir de uma tabela
de composio das relaes de direo cardinais permitiu que crissemos uma rede Bayesiana
relacional colocando os papis de relaes espaciais entre objetos de modo explicito. Esses
mecanismos de inferncia no foram testados com dados reais por falta de acesso aos mesmos.
Contudo essa pesquisa contribuiu tanto para verificar como poderamos utilizar um racioc-
nio espacial com tcnicas probabilsticas, quanto para perceber as restries do CRALC para
aplicaes em robtica onde uma hierarquia de papel fosse necessria.
A tabela de composio til quando a inferncia no vem direto das informaes dos
sensores. Esse conceito foi utilizado nas inferncias modeladas em CRALC onde no existe
um sensor que localiza a faixa exata onde o carro est. O diagrama conceitual de vizinhana
uma ferramenta que carrega o conceito de transio continua entre as relaes. Esse conceito
de transio um conceito inerente s tarefas aplicadas em robtica mvel tal como navegao,
rastreamento. Utilizamos esse conceito para criar os modelos de transio, que foram utilizados
para inferir transio do rob pelas regies e a previso para os prximos estados.
Os sistemas utilizados no captulo 4 foram codificados a partir dos algoritmos e funes
desenvolvidos especificamente sobre os axiomas da teoria de raciocnio espacial qualitativo
probabilstico. Estes sistemas esto mais robustos aos rudos nos dados de leitura do sensor e
as informaes parciais tpicas de ambientes reais. Com a formalizao dos domnios criamos
mecanismos de inferncias para obter informaes relevantes sobre o ambiente tridimensional a
partir de informaes bidimensionais.
Os resultados do captulo 5 mostram que combinar um sistema baseado em raciocnio
espacial qualitativo com filtro Bayesiano aumenta a acurcia do sistema. Ao adaptarmos o
algoritmo para realizar a auto localizao em dois contextos diferentes, pudemos perceber
que independente do contexto, combinao de um filtro de Bayesiano ao raciocnio espacial
qualitativo a abordagem que obteve melhor desempenho. Os resultados do PQRS probabilstico
e do REQ probabilstico levam a um prximo passo, colocar o rob para navegar de forma
158 Captulo 6. CONCLUSO
autnoma, e isso pode levar o sistema a melhorar a sua acurcia. Comeamos a perceber como o
diagrama conceitual de vizinhana e tabela de composio so teis nas aplicaes de raciocnio
espacial qualitativo com tcnicas probabilsticas.
Um sistema foi construdo de modo a permitir que o rob se localize relativo ao espao
onde se encontra a partir dos objetos que sejam referncia. Esse sistema possibilita o avano
para um sistema em que o rob atue em seu autocontrole, modificando a suas crenas, essa
hiptese vem do fato de termos obtidos resultados bons na auto calibrao da imagem. Imagem
tem um grande nmero de possibilidades e pode ser utilizada principalmente como suporte para
desambiguao ou aumentar o que percebido por outros sensores, para que o tempo de ao de
um rob seja melhorado. Deste modo os mtodos espaciais qualitativos devem ser utilizados
no como substitutos dos algoritmos numricos tradicionais, mas como complemento de modo
a adicionar um nvel de raciocnio em situaes em que as informaes numricas no esto
disponveis.
Estamos dando pequenos passos na direo de robs que possam conviver e interagir de
modo mais natural e intuitivo com humanos. A abordagem com raciocnio espacial qualitativo
probabilstico aqui proposta no a soluo final, mas espero que seja parte de um mecanismo
que permita no futuro uma boa interao entre homens e mquinas prxima ou igual aquelas
vistas na fico. Existem vrios possveis trabalhos futuros derivados desta pesquisa.
Seria importante realizar os experimentos da seo de auto localizao com mltiplos
objetos, com um modelo de imagem mais completo, com dados anotados durante a captura de
imagens. Analisar a complexidade dos mtodos de raciocnio espacial qualitativo probabilstico
aqui utilizados. E aplicar mtodos de programao que melhorem o desempenho em velocidade
de processamento dos algoritmos utilizados pelo rob autnomo. Passar esse cdigo para um
sistema que opere com o rob em tempo real.
Desenvolver o sistema de modo que o filtro Bayesiano combinado com os mtodos
de raciocnio espacial qualitativo seja utilizado para modificar parmetros de controle que
determinem a atuao do rob no ambiente tornando esse autnomo. Para uma navegao alm
do sistema de localizao outros pontos importantes ainda devem ser desenvolvidos. A navegao
autnoma exige tomada de deciso, quando em determinada regio necessrio ir para outra
regio, a percepo espacial indicar se as mudanas esto ocorrendo na direo certa.
Uma prxima aplicao do sistema de raciocnio espacial qualitativo probabilstico
integrar com outros mtodos de localizao robtica para formar um sistema mais robusto e
eficiente para a tarefa de localizao. A ideia que o mtodo de auto localizao qualitativa
sirva como heurstica para os mtodos probabilsticos atuais. Tambm desenvolver um algoritmo
de localizao e mapeamento qualitativo simultneo com nosso atual algoritmo de localizao.
Esses mapas qualitativos poderiam ser utilizados em sistema com dois robs, onde um rob tem
acesso visual a regio que o outro no tem. Utilizar as ferramentas que fazem o mapeamento
159
qualitativo tambm para traduzir para um significado semntico que torne o sistema capaz de
realizar uma comunicao homem-rob.
A percepo de movimento atravs da imagem agrega informao. Devemos utilizar os
sensores do rob que indicam o movimento para deixar os modelos de transio mais robustos.
Alm de que novas inferncias podem ser formalizadas a partir das mudanas de relaes
percebidas relativas ao ambiente e aquelas do prprio rob. Prevendo a ao de outros elementos
que estejam inseridos no ambiente, ou seja, comear a expandir o sistema para ser utilizados em
ambientes dinmicos. Como o ambiente de trfego utilizado neste trabalho utilizando CRALC
para inferir a localizao do veculo.
Para a aplicao do CRALC em robtica mvel seria necessrio fazer algumas alteraes:
a criao de uma regra para que ao tratar com a transitividade de uma composio de relaes,
para que essas pudessem ser definidas no banco de conhecimento; ou utilizar uma lgica de
descrio mais completa que permita a composio. Uma dificuldade inicial para a formalizao
com o CRALC foi evitar ciclos, em que cada conceito e papel deveriam ser definidos em uma
sequncia tal, que um conceito que esteja direita tenha sido definido anteriormente. Um trabalho
futuro poderia estender a linguagem de modo tal que ela mesma procuraria a melhor sequncia,
mostrando de forma mais intuitiva quando um ciclo ocorreu.
161
REFERNCIAS
BAADER, F.; CALVANESE, D.; MCGUINNESS, D.; NARDI, D.; PATEL-SCHNEIDER, P.

Description logic handbook. Cambridge University Press, 2003. Citado na pgina 62.
BAADER, F.; NUTT, W. Basic description logics. In: Description Logic Handbook. [S.l.]:
Cambridge University Press, 2002. p. 47100. Citado na pgina 65.
BACCHUS, F.; GROVE, A.; HALPERN, J. Y.; KOLLER, D. From statistical knowledge bases
to degrees of belief. Artificial Intelligence, v. 87, p. 75143, 1996. Citado na pgina 31.
BENNETT, B.; COHN, A.; MAGEE, D. Enforcing global spatio-temporal consistency to

enhance reliability of moving object tracking and classification. Knstliche Intelligenz, v. 2, p.
3235, 2005. Citado na pgina 71.
BONNER, A. J.; KIFER, M. An overview of transaction logic. Theoretical Computer Science,

Elsevier, v. 133, n. 2, p. 205265, 1994. Citado na pgina 71.
CAMPOS, C. P. de; COZMAN, F. G.; LUNA, J. E. O. Assessing a consistent set of sentences in

relational probabilistic logic with stochastic indepence. Journal of Applied Logic: Combining
Probability and Logic, v. 7, p. 137154, 2009. Citado na pgina 31.
CHEN, J.; COHN, A. G.; LIU, D.; WANG, S.; OUYANG, J.; YU, Q. A survey of qualitative
spatial representations. The Knowledge Engineering Review, Cambridge Univ Press, p. 131,
2013. Citado 3 vezes nas pginas 30, 37 e 38.
CHEN, S. Kalman filter for robot vision: a survey. Industrial Electronics, IEEE Transactions on,
IEEE, v. 59, n. 11, p. 44094420, 2012. Citado na pgina 70.
COHN, A. G.; HAZARIKA, S. M. Qualitative spatial representation and reasoning: An overview.

Fundamenta Informaticae, v. 46, n. 1-2, p. 129, 2001. Citado 2 vezes nas pginas 30 e 38.
COZMAN, F. G.; CAMPOS, C. P. D.; IDE, J. S.; ROCHA, J. C. F. da. Propositional and
relational Bayesian networks associated with imprecise and qualitative probabilistic assessments.
In: AUAI PRESS. Proceedings of the 20th conference on Uncertainty in artificial intelligence.
[S.l.], 2004. p. 104111. Citado na pgina 62.
COZMAN, F. G.; POLASTRO, R. B. Loopy propagation in a probabilistic description logic.

In: SUM 08: Proceedings of the 2nd international conference on Scalable Uncertainty
Management. Berlin, Heidelberg: Springer-Verlag, 2008. p. 120133. ISBN 978-3-540-87992-3.
Citado 7 vezes nas pginas 31, 32, 37, 62, 66, 69 e 79.
CRISTANI, M.; GABRIELLI, N. Practical issues of description logics for spatial reasoning.
In: AAAI Spring Symposium: Benchmarking of Qualitative Spatial and Temporal Reasoning
Systems. [S.l.: s.n.], 2009. p. 510. Citado na pgina 34.
CUI, Z.; COHN, A. G.; RANDELL, D. A. Qualitative simulation based on a logical formalism
of space and time. In: AAAI. [S.l.: s.n.], 1992. p. 679684. Citado 2 vezes nas pginas 39 e 118.
162 REFERNCIAS
DMATO, C.; FANIZZI, N.; LUKASIEWICZ, T. Tractable reasoning with bayesian description
logics. In: Scalable Uncertainty Management. [S.l.]: Springer, 2008. p. 146159. Citado na
pgina 31.
DELLAERT, F.; FOX, D.; BURGARD, W.; THRUN, S. Monte carlo localization for mobile
robots. In: IEEE. IEEE International Conference on Robotics and Automation. [S.l.], 1999. v. 2,
p. 13221328. Citado na pgina 70.
DING, Z.; PENG, Y. A probabilistic extension to ontology language OWL. In: IEEE.
Proceedings of the 37th Annual Hawaii international conference onSystem Sciences. [S.l.], 2004.
p. 10pp. Citado na pgina 64.
DING, Z.; PENG, Y.; PAN, R. BayesOWL: Uncertainty modeling in semantic web ontologies.
In: Soft Computing in Ontologies and Semantic Web. Berlin/Heidelberg: Springer, 2006, (Studies
in Fuzziness and Soft Computing, v. 204). p. 329. ISBN 978-3-540-33472-9. Citado na pgina
64.
DRIG, M.; STUDER, T. Probabilistic ABox reasoning: preliminary results. In: Description
Logics. [S.l.: s.n.], 2005. p. 104111. Citado 2 vezes nas pginas 31 e 63.
FELICE, G. D.; FOGLIARONI, P.; WALLGRN, J. O. A hybrid geometric-qualitative spatial

reasoning system and its application in gis. In: Spatial Information Theory. [S.l.]: Springer, 2011.
p. 188209. Citado na pgina 30.
FENELON-PEREIRA, V.; SANTOS, P. E.; COZMAN, F. G. Reconhecimento de objetos

baseado em contexto utilizando a lgica de descrio probabilstica. IX Encontro em Inteligncia
Artificial (ENIA), 2012. Citado 3 vezes nas pginas 33, 69 e 174.
FENELON, V.; HUMMEL, B.; SANTOS, P. E.; COZMAN, F. G. Encoding spatial domains
with relational bayesian networks. In: UAI 2010. [S.l.: s.n.], 2010. p. 4954. Citado 18 vezes
nas pginas 31, 32, 33, 34, 40, 66, 72, 80, 81, 82, 86, 87, 92, 93, 94, 95, 138 e 173.
FENELON, V.; SANTOS, P.; DEE, H.; COZMAN, F. Reasoning about shadows in a mobile
robot environment. Applied Intelligence, Springer US, p. 113, 2012. ISSN 0924-669X. Citado
9 vezes nas pginas 33, 34, 51, 99, 100, 101, 108, 146 e 173.
FENELON, V.; SANTOS, P. E.; MARTINS, M. F.; COZMAN., F. G. A qualitative-probabilistic

approach to autonomous mobile robot self localisation and self vision calibration. The 2nd
Brazilian Conference on Intelligent Systems (BRACIS-13), 2013. Citado 9 vezes nas pginas 33,
34, 40, 71, 119, 130, 146, 147 e 174.
FERNYHOUGH, J.; COHN, A. G.; HOGG, D. C. Constructing qualitative event models

automatically from video input. Image and Vision Computing, v. 18, p. 81103, 2000. Citado na
pgina 71.
FOGLIARONI, P.; WALLGRN, J. O.; CLEMENTINI, E.; TARQUINI, F.; WOLTER, D. A

qualitative approach to localization and navigation based on visibility information. In: Spatial
Information Theory. [S.l.]: Springer, 2009. p. 312329. Citado 2 vezes nas pginas 34 e 70.
FOX, D.; BURGARD, W.; THRUN, S. Markov localization for mobile robots in dynamic
environments. Journal of Artificial Intelligence Research, v. 11, p. 391427, 1999. Citado na
pgina 70.
REFERNCIAS 163
FRANK, A. U. Qualitative spatial reasoning: Cardinal directions as an example. International

Journal of Geographical Information Science, v. 10, n. 3, p. 269290, 1996. Citado 3 vezes nas
pginas 37, 56 e 79.
FREKSA, C. Using orientation information for qualitative spatial reasoning. In: Theories and
Methods of Spatial-Temporal Reasoning in Geographic Space. [S.l.]: Springer-Verlag, 1992,
(LNCS, v. 629). Citado na pgina 38.
FRIEDMAN, N.; KOLLER, L. G. ad D.; PFEFFER, A. Learning probabilistic relational models.

In: International Joint Conference on Artificial Intelligence. [S.l.: s.n.], 1999. p. 13001309.
Citado 2 vezes nas pginas 63 e 64.
FUHR, N. Probabilistic datalog a logic for powerful retrieval methods. In: Conference
on Research and Development in Information Retrieval. Seattle, Washington: [s.n.], 1995. p.
282290. Citado 2 vezes nas pginas 63 e 64.
FUKUSHIGE, Y. Representing probabilistic knowledge in the semantic web. In: W3C Workshop
on Semantic Web for Life Sciences. Cambridge, MA: [s.n.], 2004. Citado na pgina 63.
GALTON, A. Lines of sight. In: Proc. of the Seventh Annual Conference of AI and Cognitive
Science. Dublin, Ireland: [s.n.], 1994. p. 103113. Citado 2 vezes nas pginas 40 e 45.
GETOOR, L.; TASKAR, B. Introduction to Statistical Relational Learning. [S.l.]: MIT Press,
2007. ISBN 0262072882. Citado na pgina 64.
GIUGNO, R.; LUKASIEWICZ, T. P-SHOQ(D): A probabilistic extension of SHOQ(D) for

probabilistic ontologies in the semantic web. In: European Conference on Logics in Artificial
Intelligence. Cosenza, Italy: Springer, 2002. v. 2424, p. 8697. Citado na pgina 63.
GONZALEZ, R. E. W. R. C. Digital Image Processing. Boston, MA, USA: Addison-Wesley

Longman Publishing Co., Inc., 2001. ISBN 0201180758. Citado 4 vezes nas pginas 72, 73, 74
e 75.
GOTTS, N. M. How far can we C? defining a doughnut using connection alone. In: DOYLE,
J.; SANDEWALL, E.; TORASSO, P. (Ed.). KR94: Principles of Knowledge Representation and
Reasoning. San Francisco, California: Morgan Kaufmann, 1994. p. 246257. Citado na pgina
38.
GUO, P.; ZHANG, R.-x. Spatial topology relationships concrete domain and consistency
determination. In: IEEE. Information Engineering, 2009. ICIE09. WASE International
Conference on. [S.l.], 2009. v. 1, p. 611614. Citado na pgina 34.
HALPERN, J. Y. Reasoning about Uncertainty. Cambridge, Massachusetts: MIT Press, 2003.

Citado na pgina 63.
HANSEN, P.; JAUMARD, B. Probabilistic satisfiability. [S.l.], 1996. Citado na pgina 63.
HASENFRATZ, J. M.; LAPIERRE, M.; HOLZSCHUCH, N.; SILLION, F. X. A survey of

real-time soft shadows algorithms. Eurografhics Star - State of The Art Report, 2003. Citado na
pgina 47.
HAZARIKA, S. M.; COHN, A. G. Abducing qualitative spatio-temporal histories from partial

observations. In: Proc. of KR. Toulouse, France: [s.n.], 2002. p. 1425. Citado na pgina 71.
164 REFERNCIAS
HEINSOHN, J. Probabilistic description logics. In: Conference on Uncertainty in Artificial

Intelligence. [S.l.: s.n.], 1994. p. 311318. Citado na pgina 63.
HERMAN, D. Spatial cognition in natural-language narratives. In: Proceedings of the AAAI Fall
Symposium on Narrative Intelligence. [S.l.: s.n.], 1999. p. 2125. Citado na pgina 30.
HOLI, M.; HYVNEN, E. Modeling degrees of conceptual overlap in semantic web ontologies.
In: Uncertainty Reasoning for the Semantic Web. [S.l.: s.n.], 2005. p. 9899. Citado na pgina
63.
HUMMEL, B. Dynamic and mobile gis: Investigating changes in space and time. In: .
[S.l.]: CRC Press, 2006. cap. Map Matching for Vehicle Guidance. Citado 2 vezes nas pginas
79 e 80.
HUMMEL, B. Description Logic for Intersection Understanding at the Example of Urban Road
Intersections. Tese (Doutorado) University of Karlsruhe, April 2009. Citado 4 vezes nas
pginas 32, 64, 71 e 81.
HUMMEL, B.; THIEMANN, W.; LULCHEVA, I. Scene understanding of urban road

intersections with description logic. Logic and Probability for Scene Interpretation, n. 08091,
2008. Citado na pgina 33.
HUNG, E.; GETOOR, L.; SUBRAHMANIAN, V. S. Probabilistic interval XML. ACM

Transactions on Computational Logic, v. 8, n. 4, 2007. Citado na pgina 63.
JAEGER, M. A Probabilistic Extension of Terminological Logics. [S.l.]: Max-Planck-Institut fr

Informatik, 1994. Citado na pgina 63.
JAEGER, M. Probabilistic reasoning in terminological logics. In: Principles of Knowledge

Representation (KR). [S.l.: s.n.], 1994. p. 461472. Citado 3 vezes nas pginas 31, 62 e 63.
JAEGER, M. Relational Bayesian networks. In: Conference on Uncertainty in Artificial

Intelligence. San Francisco, California: Morgan Kaufmann, 1997. p. 266273. Citado 3 vezes
nas pginas 62, 63 e 64.
JAEGER, M.; RAEDT, L. D.; DIETTERICH, T.; GETOOR, L.; MUGGLETON, S.

Importance sampling on relational Bayesian networks. Probabilistic, Logical and Relational
Learning-Towards a Synthesis. Internationales Begegnungs-und Forschungszentrum fuer
Informatik (IBFI), 2006. Citado na pgina 62.
KANDA, T.; KAMASIMA, M.; IMAI, M.; ONO, T.; SAKAMOTO, D.; ISHIGURO, H.;
ANZAI, Y. A humanoid robot that pretends to listen to route guidance from a human. Springer
Science + Business Media, LLC 2006, Auton Robot, September 2006. Citado na pgina 38.
KERSTEN, D.; MAMASSIAN, P.; KNILL, D. C. Moving cast shadows and the perception of
relative depth. Max-Planck-Institut fuer biologische Kybernetik, Technical Report No.6, JUNE
1994. Disponvel em: <ftp://ftp.mpik-tueb.mpg.de/pub/mpi-memos/TR-006.ps.Z>. Citado 2
vezes nas pginas 47 e 48.
KNILL, D. C.; MAMASSIAN, P.; KERSTEN, D. Geometry of shadows. Journal of the Optical
Society of America A, v. 14, p. 32163232, 1997. Citado na pgina 46.
KOLLER, D.; PFEFFER, A. Object-oriented Bayesian networks. In: Conference on Uncertainty

in Artificial Intelligence. [S.l.: s.n.], 1997. p. 302313. Citado na pgina 64.
REFERNCIAS 165
KOLLER, D.; PFEFFER, A. Probabilistic frame-based systems. In: National Conference on

Artificial Intelligence (AAAI). [S.l.: s.n.], 1998. p. 580587. Citado 2 vezes nas pginas 63 e 64.
KORB, K.; NICHOLSON, A. E. Bayesian Artificial Intelligence. Boca Raton, FL, USA: CRC
Press, Inc., 2003. ISBN 1584883871. Citado na pgina 62.
KRUSE, T.; PANDEY, A. K.; ALAMI, R.; KIRSCH, A. Human-aware robot navigation: A
survey. Robotics and Autonomous Systems, Elsevier, v. 61, n. 12, p. 17261743, 2013. Citado
na pgina 69.
LAKSHMANAN, L. V. S.; SADRI, F. Probabilistic deductive databases. In: Symposium on

Logic Programming. [S.l.: s.n.], 1994. p. 254268. Citado na pgina 63.
LAKSHMANAN, L. V. S.; SHIRI, N. A parametric approach to deductive databases with

uncertainty. IEEE Transactions on Knowledge and Data Engineering, v. 13, n. 4, p. 554570,
LASKEY, K. B.; COSTA, P. C. G. da. Of starships and klingons: Bayesian logic for the 23rd
century. CoRR, abs/1207.1354, p. abs/1207.1354, 2012. Citado 2 vezes nas pginas 31 e 64.
LEVITT, T. S.; LAWTON, D. T. Qualitative navigation for mobile robots. Artificial intelligence,
Elsevier, v. 44, n. 3, p. 305360, 1990. Citado na pgina 69.
LIGOZAT, G. Reasoning about cardinal directions. J. Vis. Lang. Comput., v. 9, n. 1, p. 2344,

1998. Citado 4 vezes nas pginas 38, 58, 79 e 83.
LUKASIEWICZ, T. Expressive probabilistic description logics. Artif. Intell., Elsevier Science

Publishers Ltd., Essex, UK, v. 172, n. 6-7, p. 852883, 2008. ISSN 0004-3702. Citado na
pgina 63.
LUNA, J. E. O.; CAMPOS, C. P. de; COZMAN, F. G. Independence in relational languages

with finite domains. In: Encontro Nacional de Intelig?ncia Artificial. Rio de Janeiro, RJ: [s.n.],
2007. p. 14201429. Citado na pgina 34.
MAMASSIAN, P.; GOUTCHER, R. Prior knowledge on the illumination position. In: Cognition.
[S.l.]: Elsevier, 2001. v. 81, n. 1, p. 19(9). Citado na pgina 139.
MAMASSIAN, P.; KNILL, D. C.; KERSTEN, D. The perception of cast shadows. Trends in
cognitive Sciences, v. 2, n. 8, p. 288295, August 1998. Citado na pgina 47.
MATSUYAMA, T.; HWANG, V. S. SIGMA: A Knowledge-Based Image Understanding System.

New York, U.S.: Plenum Press, 1990. Citado na pgina 70.
MCCALL, J. C.; TRIVEDI, M. M. Video-based lane estimation and tracking for driver
assistance: Survey, system, and evaluation. IEEE Transactions on Intelligent Transportation
Systems, v. 7:1, p. 2037, 2006. Citado na pgina 71.
MCCARTHY, J. What is artificial intelligence. URL: http://www-formal. stanford.

edu/jmc/whatisai. html, 2007. Citado na pgina 38.
MCCLELLAND, M.; CAMPBELL, M.; ESTLIN, T. Qualitative relational mapping for

planetary rovers. In: Workshops at the Twenty-Seventh AAAI Conference on Artificial Intelligence.
[S.l.: s.n.], 2013. Citado na pgina 70.
166 REFERNCIAS
MILCH, B.; RUSSELL, S. First-order probabilistic languages: into the unknown. In:
International Conference on Inductive Logic Programming. [S.l.: s.n.], 2007. Citado 2 vezes
nas pginas 31 e 64.
MITRA, P.; NOY, N. F.; JAISWAL, A. OMEN: A probabilistic ontology mapping tool. In: ISWC.
[S.l.: s.n.], 2005. p. 537547. Citado na pgina 63.
MORATZ, R.; RENZ, J.; WOLTER, D. Qualitative spatial reasoning about line segments. In:
ECAI. [S.l.: s.n.], 2000. p. 234238. Citado na pgina 38.
NAGEL, H.-H. Image sequence evaluation: 30 years and still going strong. In: Proc. of ICPR.
Barcelona, Spain: [s.n.], 2000. p. 11491158. Citado na pgina 71.
NEHMZOW, U. Mobile robotics: a practical introduction. [S.l.]: Springer Verlag, 2003. Citado
2 vezes nas pginas 37 e 69.
NEUMANN, B.; MLLER, R. On scene interpretation with description logics. Image and
Vision Computing, Special Issue on Cognitive Vision, Elsevier, v. 26, n. 1, p. 82101, 2008.
Citado na pgina 71.
NGO, L.; HADDAWY, P. Answering queries from context-sensitive probabilistic knowledge

bases. Theoretical Computer Science, v. 171, n. 12, p. 147177, 1997. Citado 2 vezes nas
pginas 63 e 64.
NIKOLOV, A.; UREN, V.; MOTTA, E.; ROECK, A. de. Using the Dempster-Shafer theory
of evidence to resolve ABox inconsistencies. In: Workshop on Uncertainty Reasoning for the
Semantic Web. [S.l.: s.n.], 2007. Citado 2 vezes nas pginas 31 e 63.
NILSSON, N. J. Probabilistic logic. Artif. Intell., v. 28, n. 1, p. 7187, 1986. Citado na pgina
64.
NOTTELMANN, H.; FUHR, N. pDAML+OIL: A probabilistic extension to DAML+OIL based

on probabilistic datalog. In: Proceedings IPMU. [S.l.: s.n.], 2004. Citado na pgina 64.
NOTTELMANN, H.; FUHR, N. Adding probabilities and rules to OWL lite subsets based on
probabilistic datalog. International Journal of Uncertainty, Fuzziness and Knowledge-based
Systems, v. 14, n. 1, p. 1742, 2006. Citado na pgina 64.
PARSONS, S. Current approaches to handling imperfect information in data and knowledge

bases. IEEE Transactions on Knowledge and Data Engineering, v. 8, n. 3, p. 353372, June
1996. ISSN 1041-4347. Citado na pgina 63.
PEARL, J. Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference.

[S.l.]: Morgan Kaufmann, 1988. Citado na pgina 61.
PIRRI, F.; MENTUCCIA, I.; STORRI, S. The domestic robot: A friendly cognitive system takes
care of your home. In: BASTEN, T.; GEILEN, M. C. W.; GROOT, H. W. H. de (Ed.). Ambient
Intelligence: Impact on Embedded System Design. [S.l.]: Kluwer Academic Publishers, 2003.
Citado na pgina 37.
POLASTRO, R.; CORRA, F.; COZMAN, F.; JR, J. O. Semantic mapping with a probabilistic
description logic. SBIA, 2010. Citado na pgina 69.
REFERNCIAS 167
POLASTRO, R. B. Lgica probabilstica baseada em redes Bayesianas relacionais com

inferncia em primeira ordem. Tese (Tese (Doutorado em Engenharia de Controle e Automao
Mecnica)) Escola Politcnica, Universidade de So Paulo, Escola Politcnica, Universidade
de So Paulo, So Paulo 2012. Citado 3 vezes nas pginas 31, 67 e 68.
POOL, M.; AIKIN, J. KEEPER and protege: An elicitation environment for Bayesian inference
tools. In: Workshop on Protege and Reasoning (at the 7th International Protege Conference).
[S.l.: s.n.], 2004. Citado na pgina 63.
POOLE, D. Probabilistic Horn abduction and Bayesian networks. Artificial Intelligence, v. 64, p.
81129, 1993. Citado 2 vezes nas pginas 63 e 64.
POOLE, D.; GOEBEL, R.; ALELIUNAS, R. Theorist: A logical reasoning system for defaults
and diagnosis. In: CERCONE, N.; MCCALLA, G. (Ed.). The Knowledge Frontier Essays in
the Representation of Knowledge. [S.l.]: Springer-Verlag, 1987. p. 331352. Citado na pgina
70.
PRATI, A.; MIKIC, I.; TRIVEDI, M. M.; CUCCHIARA, R. Detecting moving shadows:
Algorithms and evaluation. IEEE Trans. Pattern Anal. Mach. Intell., IEEE Computer Society,
Washington, DC, USA, v. 25, n. 7, p. 918923, 2003. ISSN 0162-8828. Citado na pgina 47.
RANDELL, D.; CUI, Z.; COHN, A. G. A spatial logic based on regions and connection.
In: Proc. 3rd Int. Conf. on Knowledge Representation and Reasoning. San Mateo: Morgan
Kaufmann, 1992. p. 165176. Citado 5 vezes nas pginas 37, 38, 39, 40 e 45.
RANDELL, D. A.; WITKOWSKI, M. Building large composition tables via axiomatic theories.
In: Proc KR. [S.l.: s.n.], 2002. p. 2636. Citado 7 vezes nas pginas 39, 40, 41, 43, 44, 45 e 49.
RANDELL, D. A.; WITKOWSKI, M.; SHANAHAN, M. From images to bodies: Modelling
and exploiting spatial occlusion and motion parallax. In: NEBEL, B. (Ed.). IJCAI. [S.l.]: Morgan
Kaufmann, 2001. p. 5766. ISBN 1-55860-777-3. Citado 5 vezes nas pginas 37, 40, 42, 43
e 45.
REITER, R.; MACKWORTH, A. A logical framework for depiction and image interpretation.
Artificial Intelligence, v. 41, n. 2, p. 125155, 1989. Citado na pgina 70.
RENZ, J. Qualitative Spatial Reasoning with Topological Information. [S.l.]: Springer-Verlag,
SANTOS, M. V.; BRITO, R. C. de; PARK, H.-H.; SANTOS, P. Logic-based interpretation of
geometrically observable changes occurring in dynamic scenes. Applied Intelligence, v. 1, 2008.
In print. Citado na pgina 71.
SANTOS, P.; DEE, H. M.; FENELON, V. Notes on a qualitative theory of shadows. Cognitive
Robotics workshop at ECAI 2008, p. 4754, 2008. University of Patras - Patras, Greece. Citado
13 vezes nas pginas 32, 37, 46, 47, 50, 51, 52, 56, 57, 70, 99, 101 e 140.
SANTOS, P.; DEE, H. M.; FENELON, V. Qualitative robot localisation using information from
cast shadows. ICRA-09 IEEE International Conference on Robotics and Automation, 2009.
Citado 5 vezes nas pginas 32, 46, 51, 56 e 99.
SANTOS, P.; HUMMEL, B.; FENELON, V.; COZMAN, F. G. Probabilistic logic encoding of
spatial domains. In: UniDL 2010. [S.l.: s.n.], 2010. Citado 15 vezes nas pginas 31, 32, 33, 34,
66, 72, 81, 82, 86, 87, 89, 90, 91, 138 e 173.
168 REFERNCIAS
SANTOS, P.; SHANAHAN, M. Hypothesising object relations from image transitions. In:
HARMELEN, F. van (Ed.). Proc. of ECAI-02. Lyon, France: [s.n.], 2002. p. 292296. Disponvel
em: <citeseer.ist.psu.edu/532993.html>. Citado na pgina 38.
SANTOS, P.; SHANAHAN, M. Hypothesising object relations from image transitions. In:
HARMELEN, F. van (Ed.). Proc. of ECAI. Lyon, France: [s.n.], 2002. p. 292296. Citado na
pgina 71.
SANTOS, P.; SHANAHAN, M. A logic-based algorithm for image sequence interpretation and
anchoring. In: Proc. of IJCAI. Acapulco, Mexico: [s.n.], 2003. p. 14081410. Citado na pgina
71.
SANTOS, P. E. Reasoning about depth and motion from an observers viewpoint. Spatial
Cognition and Computation, v. 7, n. 2, p. 133178, 2007. Citado na pgina 71.
SCHERL, R. B.; LEVESQUE, H. J. The frame problem and knowledge-producing actions.

In: Proceedings of the Eleventh National Conference on Artificial Intelligence (AAAI-93).
Washington, D.C., USA: AAAI Press/MIT Press, 1993. p. 689697. Disponvel em:
<citeseer.ist.psu.edu/scherl93frame.html>. Citado na pgina 38.
SCHLIEDER, C. Qualitative shape representation. In: BURROUGH, P. A.; FRANK, A. U.

(Ed.). Geographic Objects with Indeterminate Boundaries. [S.l.]: Taylor & Francis Inc., 1996. p.
SCHMIDT-SCHAUSS, M.; SMOLKA, G. Attributive concept descriptions with complements.

Artificial Intelligence, v. 48, n. 1, p. 126, 1991. Citado 2 vezes nas pginas 62 e 65.
SCHROEDER, C.; NEUMANN, B. On the logics of image interpretation: Model construction

in a formal knowledge representation framework. In: International Conference on Image
Processing. Switzerland: [s.n.], 1996. v. 2, p. 785788. Citado na pgina 71.
SCHULZ, R.; GLOVER, A.; MILFORD, M. J.; WYETH, G.; WILES, J. Lingodroids: Studies
in spatial cognition and language. In: IEEE. Robotics and Automation (ICRA), 2011 IEEE
International Conference on. [S.l.], 2011. p. 178183. Citado na pgina 30.
SEBASTIANI, F. A probabilistic terminological logic for modelling information retrieval. 1994.

Citado na pgina 31.
SEBASTIANI, F. A probabilistic terminological logic for modelling information retrieval. In:

International ACM Conference on Research and Development in Information Retrieval. Dublin,
Ireland: Springer-Verlag, 1994. p. 122130. Citado na pgina 63.
SHANAHAN, M. Robotics and the common sense informatic situation. In: Proc. of ECAI.
Budapest, Hungary: [s.n.], 1996. p. 684688. Citado na pgina 71.
SHAPIRO, L. G.; STOCKMAN, G. C. Computer Vision. [S.l.]: Tom Robbins, 2001. 371-409 p.
Citado 3 vezes nas pginas 73, 74 e 75.
SHAPIRO, S. C. Knowledge representation. Encyclopedia of Cognitive Science, Macmillan

Puvlishers Ltd, v. 2, p. 671680, 2003. Citado na pgina 29.
SHIRAZI, A.; AMIR, E. Probabilistic modal logic. In: AAAI07: Proceedings of the 22nd
national conference on Artificial intelligence. [S.l.]: AAAI Press, 2007. p. 489495. ISBN
978-1-57735-323-2. Citado na pgina 30.
REFERNCIAS 169
SIEGWART, R.; NOURBAKHSH, I. R. Introduction to Autonomous Mobile Robots. [S.l.]: The

MIT press, 2004. Citado na pgina 69.
SJ, K.; AYDEMIR, A.; JENSFELT, P. Topological spatial relations for active visual search.
Robotics and Autonomous Systems, Elsevier, v. 60, n. 9, p. 10931107, 2012. Citado 2 vezes
nas pginas 34 e 35.
SKIADOPOULOS, S.; KOUBARAKIS, M. Composing cardinal direction relations. In:

Advances in Spatial and Temporal Databases. [S.l.]: Springer, 2001. p. 299317. Citado na
pgina 93.
STAKER, R. Reasoning in expressive description logics using belief networks. In: International
Conference on Information and Knowledge Engineering. Las Vegas, USA: [s.n.], 2002. p.
STOCK, O. Spatial and Temporal Reasoning. Norwell, MA, USA: Kluwer Academic Publishers,
1997. ISBN 0792346440. Citado 4 vezes nas pginas 30, 37, 38 e 39.
STRACCIA, U. Description logics with fuzzy concrete domains. In: Conference on Uncertainty
in Artificial Intelligence. [S.l.: s.n.], 2005. Citado na pgina 63.
STUART, R.; PETER, N. Artificial Intelligence: a Modern Approach. New Jersey,USA:

Prentice-Hall, 2010. Citado 2 vezes nas pginas 60 e 61.
THRUN, S. Robotic mapping: A survey. Exploring artificial intelligence in the new millennium,
Morgan Kaufmann San Mateo, CA, p. 135, 2002. Citado 2 vezes nas pginas 31 e 70.
THRUN, S.; BURGARD, W.; FOX, D. et al. Probabilistic robotics. [S.l.]: MIT press Cambridge,
2005. Citado 5 vezes nas pginas 29, 31, 59, 60 e 70.
UDREA, O.; SUBRAHMANIAN, V. S.; MAJKIC, Z. Probabilistic RDF. In: IEEE International
Conference on Information Reuse and Integration. [S.l.: s.n.], 2006. p. 172177. Citado na
pgina 63.
VINCI, L. da. The Notebooks of Leonardo da Vinci. [S.l.]: Dover, 1970. Citado na pgina 46.
WAGNER, T.; VISSER, U.; HERZOG, O. Egocentric qualitative spatial knowledge

representation for physical robots. Robotics and Autonomous Systems, Elsevier, v. 49, n. 1, p.
2542, 2004. Citado na pgina 70.
WELLMAN, M. P.; BREESE, J. S.; GOLDMAN, R. P. From knowledge bases to decision

models. Knowledge Engineering Review, v. 7, n. 1, p. 3553, 1992. Citado 2 vezes nas pginas
63 e 64.
WITKOWSKI, M.; SHANAHAN, M.; SANTOS, P.; RANDELL, D. Cognitive robotics: On the
semantic knife-edge. In: Towards Intelligent Mobile Robots. [S.l.: s.n.], 2001. Citado 2 vezes
nas pginas 45 e 46.
WOLTER, D.; FREKSA, C.; LATECKI, L. J. Towards a generalization of self-localization.

In: Robotics and cognitive approaches to spatial mapping. [S.l.]: Springer, 2008. p. 105134.
Citado na pgina 70.
170 REFERNCIAS
WOLTER, D.; WALLGRN, J. O. Qualitative spatial reasoning for applications: New

challenges and the sparq toolbox. Qualitative spatio-temporal representation and reasoning:
Trends and future directions. IGI Global, Hershey. doi, v. 10, p. 9781, 2012. Citado na pgina
29.
YANG, Y.; CALMET, J. OntoBayes: An ontology-driven uncertainty model. In: Proceedings

IAWTIC. [S.l.: s.n.], 2005. Citado na pgina 63.
YELLAND, P. M. Market analysis using a combination of Bayesian networks and description

logics. [S.l.], 1999. Citado na pgina 64.
171
GLOSSRIO
Axioma "Na lgica tradicional, um axioma ou postulado uma

sentena ou proposio que no provada ou demonstrada
e considerada como bvia ou como um consenso inicial
necessrio para a construo ou aceitao de uma teoria.
Por essa razo, aceito como verdade e serve como ponto
inicial para deduo e inferncias de outras verdades
(dependentes de teoria)". wikipedia
Frmula "Em Lgica, uma frmula uma frase, construda segundo
as regras gramaticais de uma determinada linguagem formal,
a respeito de objetos do universo de discurso."fonte: wikipedia
Heurstica do dicionrio Houaiss - ...mtodo de investigao
baseado na aproximao progressiva de um dado problema...
Hodmetro do dicionrio Houaiss - ... instrumento que indica distncia
percorridas por pedestres ou por veculos. Observao: forma
no preferencial: odmetro.
mereologia do Wikcionrio "(Lgica) teoria ou estudo lgico-matemtico das
relaes entre as partes e o todo e das relaes entre as partes
no interior de um todo."
mereotopologia traduo livre de mereotopology
mereotopology is a first-order theory, embodying mereological and topological
concepts, of the relations among wholes, parts, parts of parts,
and the boundaries between parts.
Paralaxe do dicionrio Houaiss...deslocamento aparente de um objeto
quando se muda o ponto de observao...
Penumbra meia-luz, sombra parcial.
Psicofsicos do dicionrio Houaiss Relativo a psicofsica. Psicofsica
o ramo da psicologia que estuda a relao entre estmulos
fsicos e as respectivas sensaes.
Satisfazibilidade termo utilizado neste trabalho, para substituir o termo
Satisfatibilidade , por ter como raiz a palavra satisfazer.
Satisfatibilidade do ingls Satisfiability um conceito em lgica
matemtica ...do wikipdia "Uma frmula satisfatvel
se possvel achar uma interpretao ( modelo)
que torne a frmula verdadeira."
Segmentao ato de separar por caracterstica.
Topolgico do dicionrio Priberam da Lngua Portuguesa "adjetivo - relativo
topologia."
http://www.priberam.pt/dlpo/topol%c3%b3gico [consultado em 12-01-2014].
173
ANEXO A TRABALHOS PUBLICA-

DOS
Os artigos publicados durante o doutorado esto relacionados abaixo. Os trabalhos

relatados nestes artigos fazem parte dessa tese. Em ordem cronolgica:
Probabilistic logic encoding of spatial domains (SANTOS et al., 2010).
This paper presents a formalisation of a spatial domain in terms of a qualitative

spatial reasoning formalism, encoded in a probabilistic description logic. The
QSR formalism chosen is a subset of a cardinal direction calculus and the
probabilistic description logic used has the relational structures of the well-
known ALC language, allied with the inference methods of Bayesian Networks.
We consider a scenario consisting of a road navigated by an experimental
vehicle equipped with three on-board sensors: a digital map, a GPS and a video
camera. This paper presents experiments where the proposed formalism is used
to answer queries about driving directions, lanes and vehicles.
Encoding spatial domains with relational Bayesian networks (FENELON et al., 2010).
This paper investigates an encoding of a probabilistic TBox using relational

Bayesian networks that are specified through a probabilistic description logic.
The probabilistic description logic extends the popular ALC language; on top of
this language we add a few operations that are needed to represent the cardinal
direction calculus. Using such resources we model roads containing lanes, and
vehicles containing digital maps, GPS and video cameras.
Reasoning about shadows in a mobile robot environment (FENELON et al., 2012).
This paper describes a logic-based formalism for qualitative spatial reasoning

with cast shadows (Perceptual Qualitative Relations on Shadows, or PQRS) and
presents results of a mobile robot qualitative self-localisation experiment using
this formalism. Shadow detection was accomplished by mapping the images
from the robots monocular colour camera into a HSV colour space and then
thresholding on V. We present results of self-localisation using two methods for
obtaining the threshold automatically: in one method the images are segmented
according to their grey-scale histograms, in the other, the threshold is set
according to a prediction about the robots location, given a shadow-based map
defined using a qualitative spatial reasoning theory. This map-related threshold
174 ANEXO A. TRABALHOS PUBLICADOS
search is the main contribution of the present work, and to the best of our
knowledge this is the first work that uses qualitative spatial representations both
to perform egolocation and to calibrate a robots interpretation of its perceptual
input.
Reconhecimento de Objetos Baseado em Contexto Utilizando a Lgica de Descrio

Probabilstica (FENELON-PEREIRA; SANTOS; COZMAN, 2012).
Agentes robticos ainda no tm a habilidade de raciocinar sobre objetos

em cenas reais. Neste artigo propomos uma abordagem em que o contexto
de objetos modelado por meio de uma lgica de descrio probabilstica
(CRALC), e onde os dados extrados por viso computacional so fontes de
informao para inferncias sobre objetos. Em nossos experimentos usamos o
algoritmo SURF (Speed Up Robust Features) para obter descritores de objetos
em imagens capturadas de dois ambientes distintos. Os resultados apresentam
um aumento nas respostas positivas devido modelagem de contexto por meio
de CRALC.
A Qualitative-Probabilistic Approach to Autonomous Mobile Robot Self Localisation and

Self Vision Calibration (FENELON et al., 2013)
Typically, the spatial features of a robots environment are specified using

metric coordinates, and well-known mobile robot localisation techniques are
used to track the exact robot position. In this paper, a qualitative-probabilistic
approach is proposed to address the problem of mobile robot localisation.
This approach combines a recently proposed logic theory called Perceptual
Qualitative Reasoning about Shadows (PQRS) with a Bayesian filter. The
approach herein proposed was systematically evaluated through experiments
using a mobile robot in a real environment, where the sequential prediction and
measurement steps of the Bayesian filter are used to both self-localisation and
self-calibration of the robots vision system from the observation of objects
and their shadows. The results demonstrate that the qualitative-probabilistic
approach effectively improves the accuracy of robot localisation, keeping the
vision system well calibrated so that shadows can be properly detected.

Avaliação e Interpretação Do Raciocínio Espacial - Scribd PDF

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Avaliação e Interpretação Do Raciocínio Espacial - Scribd PDF

Uploaded by

Copyright:

Available Formats

VALQUIRIA FENELON PEREIRA

Interpretao de Imagens com Raciocnio Espacial

Interpretao de Imagens com Raciocnio Espacial

Tese apresentada Escola Politcnica da

Interpretao de Imagens com Raciocnio Espacial

Tese apresentada Escola Politcnica da Univer-

rea de Concentrao: Engenharia de Controle e

Orientador: Prof. Dr. Fbio Gagliardi Cozman

So Paulo, 23 de abril de 2014.

Assinatura do autor ____________________________

Assinatura do orientador _______________________

Pereira, Valquiria Fenelon

Tese (Doutorado) - Escola Politcnica da Universidade de

Antes de comear a lista de agradecimentos, quero dizer que experimentei sensaes

Palavras-chaves: Raciocnio Espacial Qualitativo, Filtro Bayesiano, Lgica Proba-

Key-words: Qualitative Spatial Reasoning, Bayesian Filter, Probabilistic Logic, Cognitive

Figura 58 O ambiente utilizado para a coleta de imagens com sombra. . . . . . . . . . . . . . . 140

Tabela 1 Definies e interpretaes de algumas relaes do RCC. . . . . . . . . . . . . . . . 39

Tabela 14 O resultado do experimento de auto localizao utilizando um filtro Bayesiano e o Raciocnio

ARIA ActivMedia Robotics Interface for Applications ou Interface robtica Activ-

CN D Conceptual Neighbourhood Diagram ou diagrama conceitual de vizinhaa.

CDC Clculo de Direo Cardeal.

CRALC Credal ALC.

DP C Distribuio de probabilidade condicional.

P QRS Perceptual Qualitative Relations about Shadows ou relaes perceptuais

QSR Qualitative Spatial Reasoning ou REQ Raciocnio Espacial Qualitativo.

RCC Region Connection Calculus ou clculo sobre conexo de regio.

REQ Raciocnio Espacial Qualitativo.

ROC Region Occlusion Calculus ou clculo sobre ocluso de regio.

ROI Region Of Interest ou regio de interesse (regies em uma imagem).

SU RF Speeded Up Robust Features.

Relaes espaciais tridimensionais de ocluso.

Relaes espaciais tridimensionais de ocluso.

Relaes espaciais bidimensionais.

L Constante que representa a fonte de luz.

Scr Constante que representa a superfcie onde uma sombra projetada.

sk Luminncia dos pontos na imagem do instante k.

Dk Diferena da luminncia de uma imagem do instante k.

3 RACIOCNIO ESPACIAL QUALITATIVO COM LGICA DE DESCRIO PRO-

4 RACIOCNIO ESPACIAL QUALITATIVO PROBABILSTICO PARA LOCALI-

5 EXPERIMENTOS EM RACIOCNIO ESPACIAL QUALITATIVO PROBABI-

A TRABALHOS PUBLICADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

conversar com pessoas em linguagem natural;

resolver problemas em reas em que o conhecimento humano normalmente requerido

Pesquisas em representao de conhecimento comearam por volta de 1958 com a

planejamento e navegao robtica;

interpretao de dados de entrada visuais;

compreenso da linguagem natural.

Em todos esses casos a necessidade de representar e raciocinar sobre aspectos espaciais do

1. Estudo das lgicas de descrio probabilsticas e formalismos de raciocnio espacial

2. Desenvolvimento de uma teoria lgica probabilstica que permita representar cenas em

3. Combinao de diferentes clculos de raciocnio espacial com um filtro Bayesiano.

4. Desenvolvimento de filtro Bayesiano com informao qualitativa no problema de auto

5. Validao emprica do sistema desenvolvido a partir de testes com um rob.

As contribuies acima mencionadas foram temas em artigos publicados durante o

Probabilistic logic encoding of spatial domains (SANTOS et al., 2010).

Reasoning about shadows in a mobile robot environment (FENELON et al., 2012).

Reconhecimento de Objetos Baseado em Contexto Utilizando a Lgica de Descrio

A Qualitative-Probabilistic Approach to Autonomous Mobile Robot Self Localisation and

Neste trabalho existem duas abordagens. Em comum existe um problema de localizao

1.1 Trabalhos Relacionados

2.1 Robtica Cognitiva

2.2 Raciocnio Espacial Qualitativo