Professional Documents
Culture Documents
So Paulo
2014
VALQUIRIA FENELON PEREIRA
So Paulo
2014
VALQUIRIA FENELON PEREIRA
So Paulo
2014
Este exemplar foi revisado e corrigido em relao verso original, sob
responsabilidade nica do autor e com a anuncia de seu orientador.
Catalogao-na-publicao
Figura 1 Diagrama conceitual de vizinhana (CND - Conceptual Neighborhood Diagram) das relaes
RCC-8. Note a continuidade das transies topolgicas entre regies (indicadas pelas setas),
as mudanas de relaes ocorrem sempre para uma relao vizinha. . . . . . . . . . . . 39
Figura 2 Representao grfica das composies R1 (a, b) e R2 (b, c) antes e depois da transio
representada pela seta, note que o conjunto resultante R3 (a, c) so as relaes possveis
(Tabela 2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Figura 3 Duas sequncias de imagens (da esquerda para direita) onde um cone passa em frente
(sequncia superior) e por trs (sequncia inferior) do cilindro, este um exemplo da ocluso
em ao. Note na ocorrncia de ocluso os dois objetos formam uma nica regio na imagem. 42
Figura 4 Mudana na percepo da ocluso causada pelo movimento do observador (paralaxe). . . . 43
Figura 5 Modelo grfico das 20 relaes bsicas do clculo sobre ocluso de regio, o ROC-20. . . 44
Figura 6 Estudos sobre sombra de Leonardo da Vinci. No esboo v-se representados as sombras do
objeto projetadas em outra superfcie (sombra-projetada) e no prprio objeto (sombra-prpria). 46
Figura 7 Efeito na localizao do objeto ocasionado pela posio da sombra. . . . . . . . . . . . 47
Figura 8 Bola na caixa. Mesmo na mesma localizao da bola em (b) e (c) percebemos posicionamen-
tos diferentes devido sombra. . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Figura 9 Representao grfica das relaes bsicas do PQRS. . . . . . . . . . . . . . . . . . 49
Figura 10 Imagens capturadas pelo P eopleBotT M . Representando as relaes PQRS (a) NonOc-
cludesDC(o,s), (b) NonOccludesEC(o,s), (c) PartiallyOccludesPO(o,s), (d) PartiallyOcclu-
desTPP(o,s), (e) TotallyOccludesTPPI(o,s), (f) TotallyOccludesEQ(o,s) e (g) TotallyOcclu-
desNTPPI(o,s). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Figura 11 (a) Um objeto com sua sombra conectada e projetada numa superfcie irregular, destaque
para a parte da sombra relativa a parte superior do objeto; (b) Regies distintas expressas
pela observao do objeto e sua sombra, definidas pelas linhas de viso. . . . . . . . . . 52
Figura 12 Como a sombra aparece quando somente o observador altera sua posio para: (a) regio 1,
(b) regio 2, (c) regio 3, (d) regio 4 e (e) regio 5 representadas no mapa da Figura 11b . 54
Figura 13 Imagens capturadas no laboratrio, onde podemos aplicar a frmula de correspondncia de
sombra, note somente a sombra do objeto est externamente conectada sua base e mais
distante da fonte de luz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
Figura 14 Por causa das sombras podemos inferir que h outro objeto totalmente ocluso pelo balde. . 57
Figura 15 Representao da projeo em quadrante, sendo os elementos representados como ponto
(direito) e regio (esquerda). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
Figura 16 Exemplo de representao CRALC em rede Bayesiana da incluso e da definio. . . . . 67
Figura 17 Exemplo de redes e tabelas de probabilidades condicionais geradas pelos construtores lgicos 67
Figura 18 Exemplo de representao CRALC em rede Bayesiana da restrio de existencial. . . . . 68
Figura 19 Exemplo de representao CRALC em rede Bayesiana da restrio universal. . . . . . . 68
Figura 20 Exemplo grfico de uma rede gerada a partir de uma terminologia , e sua caracterstica para
um domnio com dois indivduos [a, b] . . . . . . . . . . . . . . . . . . . . . . . . 69
Figura 21 Representao grfica do cubo de cores RGB, o cone da esquerda representa como uma
cor(80,200,130) est localizada neste sistema cartesiano. . . . . . . . . . . . . . . . . 73
Figura 22 Representao grfica do cone HSV. . . . . . . . . . . . . . . . . . . . . . . . . . 73
Figura 23 Grfico representando o filtro de limiar e o limiar T . . . . . . . . . . . . . . . . . . 74
Figura 24 Representao grfica da dilatao e da eroso com uma matriz 3x3 com elemento estrutu-
rante E. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
Figura 25 Exemplo da aplicao do componente conectado, a partir da imagem original (esquerda) um
filtro limiar e morfolgico aplicado (meio) o resultado na imagem com grupos de mesmo
valor (representado pela cor). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
Figura 26 Representao grfica do cenrio de trfego (mo francesa). (a) Representao da rua, faixa,
e linhas divisrias. (b) Representao do veculo no cenrio. . . . . . . . . . . . . . . 80
Figura 27 (a) Cena Original. (b) Exemplo dos dados dos sensores para o cenrio da cena original. . . 81
Figura 28 Um sistema cardeal para vias: A est ao sul de B e oeste de C. . . . . . . . . . . . . . 82
Figura 29 Domnio de trfego e todas as situaes possveis para o veculo que esteja dentro das regras. 86
Figura 30 Rede Bayesiana formada com conceitos e papis embutidos no banco de conhecimento.
Todos os ns em azul so evidncias observadas pelos sensores. . . . . . . . . . . . . 89
Figura 31 Exemplo de trs cenrios de trfego, onde o carro est descendo uma via de mo nica. . . 91
Figura 32 Rede Bayesiana relacional representando um domnio de trafego com papis e indivduos
representando veculo, faixas, e linha divisria. . . . . . . . . . . . . . . . . . . . 92
Figura 33 Rede Bayesiana baseado na tabela de composio (Tabela 8) . . . . . . . . . . . . . . 93
Figura 34 Representao espacial (a) das regies considerando um ambiente real, e (b) representao
do mapa qualitativo com a cinco regies distintas, mostrando os lados direito e esquerdo e as
regies(Region1 at Region5 ). As linhas de viso entre a fonte de luz L, o objeto O e sua
sombra definem as fronteiras entre as regies. Neste diagrama somente o topo da sombra
utilizado na definio das regies. . . . . . . . . . . . . . . . . . . . . . . . . . . 101
Figura 35 Uma representao da posio dos objetos no contexto deste experimento. . . . . . . . . 101
Figura 36 Uma representao grfica para a definio das direes Left, Right, Front e Behind (esquerda,
direita, em frente, atrs) relativos viso do rob atravs da imagem. Os eixos de coordenadas
da imagem tem origem no canto acima-direito relativo imagem. . . . . . . . . . . . . 103
Figura 37 Diagrama representando nove regies formadas pelas linhas de viso. . . . . . . . . . . 103
Figura 38 As duas figuras representam as regies e as relaes espaciais percebidas em cada uma
(a)As relaes de ocluso e (b) as relaes de direo para cada regio, todas as relaes
percebidas por um observador . Somente a regio Region9 no possvel visualizar o par
em nenhuma posio do observador. . . . . . . . . . . . . . . . . . . . . . . . . . 104
Figura 39 Exemplo de uma visualizao para (a) Region1 , (b) Region2 , (c) Region3 , (d) Region4 ,
(e) Region5 , (f) Region6 , (g) Region7 , (h) Region8 , (i e j) Region9 onde os objetos esto
livres de ocluso, mas o campo de viso no permite visualizar os dois em uma mesma cena. 106
Figura 40 Representaes dos mapas qualitativos formados pelas linha de viso com duas configuraes
de posio que os trs objetos podem assumir neste contexto. . . . . . . . . . . . . . 107
Figura 41 Imagens capturadas com o rob posicionado em distintos pontos na regio 1. A imagem (c)
mostra somente o topo da sombra em destaque. Note que o objeto no oclui a sombra. . . 108
Figura 42 Imagens capturadas com o rob na regio 2. Note que o objeto comea a ocluir a sombra.
Todavia ainda se v a sombra do topo do objetivo e as laterais da sombra do objeto indicados
em (a). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
Figura 43 Imagens capturadas com o rob na regio 3. A sombra nesta regio aparece com um dos
lados totalmente ocluso pelo objeto. Existe uma conexo entre a parte superior do objeto e
sua sombra projetada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
Figura 44 Imagens capturadas com o rob na regio 4. A sombra nesta regio quase desaparece oclusa
pelo objeto. Contudo ainda existe uma conexo entre a parte superior do objeto e a sombra. 110
Figura 45 Imagem capturada com o rob na regio 5. A sombra do objeto no aparece na imagem por
estar totalmente oclusa. O observador est na regio equivalente ao ponto de vista da luz. . 111
Figura 46 Mapa qualitativo da disposio espacial dos objetos e a representao das regies. . . . . 112
Figura 47 Mapa qualitativo das reas de atuao divididas em oito regies. . . . . . . . . . . . . 117
Figura 48 Diagrama conceitual de vizinhana (CND) das relaes que determinam a regio na qual
o rob estava localizado. As transies esto representadas pelas setas e a mudana ocorre
sempre para uma relao (regio) vizinha. . . . . . . . . . . . . . . . . . . . . . . 118
Figura 49 Representao das regies como ns, e das transies entre regies prximas como setas:
setas contnuas regies com fronteira, tracejadas regies sem fronteira entre elas. . . . . . 119
Figura 50 Janelas para calibrao manual dos parmetros de viso utilizados no filtro de limiar para
segmentar objeto e sombra, os valores escolhidos pela barra de rolagem ficam indicados
esquerda da barra. Da esquerda para direita da figura: define o limiar T h que separa objeto e
sombra do ambiente; define o limiar que separa objeto da sombra; define o limiar que separa
a sombra do objeto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
Figura 51 Exemplo de sequncia da segmentao de um quadro na deteco ROI:(a) canal V, (b) canal
V aps limiar acima , (c) filtro morfolgico, (d) retngulo verde indica regies candidatas a
regio de interesse (ROI), (e) canal S aps filtro passa-alta sat , (f) mscara ROI. . . . . . 126
Figura 52 Exemplo de sequncia da segmentao de um quadro na deteco de objetos: (a) Imagem
objeto e sombra depois de aplicado a mscara, (b) filtro de limiar abaixo e filtro morfolgico,
(c) imagem binria da base do objeto, (d) retngulo azul indica objetos encontrados na
segmentao, (e) ltima mscara ROI criada pelo sistema de viso. . . . . . . . . . . . 128
Figura 53 Exemplo de sequncia da segmentao de um quadro na deteco de sombras: (a) Imagem
com objeto depois de aplicada a segunda mscara, (b) Imagem aps filtros de limiar acima e
morfolgico de abertura, (c) retngulo limitador vermelho indicando a sombra localizada. . 129
Figura 54 Exemplo de segmentao do objeto e sua sombra. O topo da sombra tambm detectado
pelo sistema de viso conforme destacado nesta imagem. . . . . . . . . . . . . . . . 130
Figura 55 Exemplo de sequncia da segmentao de um quadro na deteco ROI:(a) canal V, (b) canal
V aps limiar acima , (c) filtro morfolgico, (d) retngulo verde indica regies candidatas a
regio de interesse (ROI), (e) canal S aps filtro passa-alta sat , (f) mscara ROI. . . . . . 132
Figura 56 Imagem exemplo de busca de regies externamente conectadas, para cada sombra todas as
bases de objetos so verificadas onde as bordas se encontram intensidade aumenta e EC
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
verdade.
Figura 57 Imagem exemplo para definio de relaes topolgica de ocluso. . . . . . . . . . . . 138
Tabela 3 Matriz de confuso do sensor de captura de imagem em que colunas representam o tipo de
linha divisria real enquanto que as linhas representam como a linha divisria foi classificada
pelo sistema. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
Tabela 4 Matriz de confuso dos valores de probabilidade de resposta do sensor mapa digital em
que colunas representam o tipo de rua enquanto que as linhas representam como a rua foi
classificada pelo sistema. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
Tabela 5 Tabela com oito estados dos sensores indicando as dozes possibilidades de estado do veculo
conforme representado na Figura 29. Com as coordenadas mudando relativas ao sentido de
deslocamento do carro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
Tabela 6 Resposta da rede Bayesiana representada na Figura 30 para a primeira questo: qual faixa
tem maior probabilidade do carro estar localizado. As evidncias referentes aos dados dos
trs sensores (A) esto expressas nas trs primeiras colunas. . . . . . . . . . . . . . . 90
Tabela 7 Resposta da pergunta dois a partir da rede Bayesiana da Figura 30: a probabilidade para a
direo de a faixa ser Down dado s evidncias A (expressas nas seis primeiras colunas). . 91
Tabela 8 Tabela de composio do cdc para o domnio de trfego . . . . . . . . . . . . . . . . 93
Tabela 9 Tabela que apresenta quantidade de vezes que uma faixa pode ocorrer dada a combinao
das caractersticas que podem ser percebidas pelos sensores. . . . . . . . . . . . . . . 94
Tabela 10 Resposta da primeira questo: "qual faixa tem maior probabilidade do carro estar locali-
zado?"As evidncias (A) esto expressas nas seis primeiras colunas referentes aos dados dos
trs sensores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
Tabela 11 Resposta da pergunta dois a partir da rede Bayesiana da Figura 32: a probabilidade para a
direo de a faixa ser Down dado s evidncias A (expressas nas seis primeiras colunas). . 95
Tabela 12 O modelo de movimento considerando que o rob tem uma navegao no sentido horrio.
Este modelo baseado no tamanho qualitativo e na transio das regies. O valores so
alterados por uma funo de mudana percebida w que representa a paralaxe causada pelo
movimento do rob . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
Tabela 13 Tabela com os valores que diferenciam as caractersticas em cada relao. . . . . . . . . 122
HSV Hue, Saturation, Value ou espao de cores com trs canais, matiz, saturao
e valor.
OpenCV Intel Open Source Computer Vision. Library ou biblioteca de viso compu-
tacional com cdigo aberto.
RGB Red, Green, Blue ou espao de cores com trs canais, vermelho, verde e
azul.
Representa o observador.
s Sombra.
o Objeto fsicos.
t Instante de tempo.
r Regies.
1 INTRODUO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.1 Trabalhos Relacionados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.2 Organizao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2 FUNDAMENTOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.1 Robtica Cognitiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.2 Raciocnio Espacial Qualitativo . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.2.1 Clculo sobre conexo de regies . . . . . . . . . . . . . . . . . . . . 38
2.2.2 Clculo sobre ocluso de regio . . . . . . . . . . . . . . . . . . . . . 42
2.2.3 Relaes qualitativas percebveis sobre sombras . . . . . . . . . . . . . 46
2.2.3.1 Localizao relativa . . . . . . . . . . . . . . . . . . . . . . 51
2.2.3.2 Correspondncia entre objeto e sombra . . . . . . . . . . . . 53
2.2.4 Clculo de direes cardinais . . . . . . . . . . . . . . . . . . . . . . . 56
2.3 Modelos Probabilsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.3.1 Filtros Bayesianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.3.2 Redes Bayesianas relacionais . . . . . . . . . . . . . . . . . . . . . . . 61
2.4 Lgica de Descrio Probabilstica Credal ALC . . . . . . . . . . . . . . . . . 62
2.4.1 Lgica de descrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.4.2 Lgica de descrio probabilstica . . . . . . . . . . . . . . . . . . . . 63
2.4.3 Credal ALC - CRALC . . . . . . . . . . . . . . . . . . . . . . . . . . 65
2.5 Localizao Robtica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
2.6 Interpretao de Imagens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
2.7 Viso Computacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
2.7.1 Espao de cores em imagens digitais . . . . . . . . . . . . . . . . . . . 72
2.7.2 Filtro de limiar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
2.7.3 Filtros morfolgicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
2.7.4 Detectores de borda . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
2.7.5 Componentes conectados . . . . . . . . . . . . . . . . . . . . . . . . . 76
I Primeira Contribuio 77
II Segunda Contribuio 97
6 CONCLUSO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
REFERNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
GLOSSRIO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
1 INTRODUO
No seria bom se nossos carros fossem capazes de funcionar de modo seguro no piloto
automtico, tornando acidentes de carro em algo do passado? Ou se robs domsticos fossem
assistentes inteligentes para tomar conta de reparos e cuidassem das tarefas de manuteno
e limpeza da casa? Ou fossem capazes de auxiliar no cuidado de pessoas com necessidades
especiais? Para fazer essas tarefas, um rob deve ser capaz de raciocinar sobre o mundo em
que est inserido utilizando um conhecimento a priori e dados percebidos atravs de sensores
(THRUN et al., 2005). A representao de conhecimento uma rea de Inteligncia Artificial que
trata do modo de representar e entender informaes em computadores, para que os programas
possam:
ser utilizados na obteno de informaes que esto implcitas a partir das informaes
presentes;
planejar atividades;
desnecessrias ou indisponveis para o ser humano (CHEN et al., 2013). O Raciocnio Espacial
Qualitativo (REQ) procura formalizar o conhecimento espacial, baseado em relaes primitivas
definidas sobre entidades espaciais elementares. As teorias de raciocnio espacial utilizam muitos
modelos espaciais que, com primitivas ontolgicas e mtodos de raciocnio, predizem, explicam
e diagnosticam comportamentos de um sistema fsico de modo qualitativo, sempre que uma
avaliao quantitativa for intratvel ou no avalivel (STOCK, 1997).
Em particular as pesquisas em REQ tm aplicaes em reas tais como: sistema de
informao geogrfica (FELICE; FOGLIARONI; WALLGRN, 2011), questes de linguagem
espacial (SCHULZ et al., 2011), linguagem natural (HERMAN, 1999), entre outros campos. Em
Cohn e Hazarika (2001) e Chen et al. (2013) encontra-se um apanhado mais detalhado desta
rea. Vrios formalismos de relaes espaciais qualitativas tm sido propostos para descrever
diversos aspectos espaciais. Nesse trabalho nos concentraremos somente nos clculos espaciais
qualitativos topolgicos representados pelo clculo de conexo de regies e sua extenso o clculo
de ocluso de regies que representam as relaes entre duas regies de modo bidimensional e
tridimensional. E os clculos sobre relaes de direes como o clculo de direo cardinal que
representa a relao de direo entre duas entidades espaciais.
A necessidade de clculos que permitam uma representao e raciocnio espacial est
presente em:
1 (verdadeiro). Deste modo uma lgica probabilstica representado por uma generalizao
semntica lgica cujo o valor verdadeiro da sentena um valor de probabilidade.
Na ltima dcada houve um interesse crescente em combinar raciocnio probabilstico
e teoria lgica, e em particular a lgica de descrio, a qual fragmento da lgica de primeira
ordem e teve sua origem nos anos 70s (MILCH; RUSSELL, 2007; NIKOLOV et al., 2007;
CAMPOS; COZMAN; LUNA, 2009). Essa combinao no motivada somente pelo interesse
terico puro, mas por sua relevncia do ponto de vista de aplicaes prticas, com a finalidade
de equipar um sistema de raciocnio com inferncias relacionais capazes de fazer tambm as
avaliaes probabilsticas (SANTOS et al., 2010; FENELON et al., 2010). Existem algumas
lgicas probabilsticas distintas, como as propostas em Jaeger (1994b), Sebastiani (1994a), que
foram definidas sobre um subconjunto de elementos do domnio. Estas lgicas tm dificuldade
em tratar com asseres probabilsticas para indivduos, como informao estatstica sobre o
domnio que no implica em informao sobre indivduos; isto conhecido como problema de
inferncia direta (BACCHUS et al., 1996). O problema da inferncia direta est resolvido em
Drig e Studer (2005) pela adoo de probabilidade somente nas asseres.
Um modo alternativo de contornar o problema de inferncia direta atribuir probabili-
dades a subconjuntos de interpretaes, como assumido em Laskey e Costa (2012), dmato,
Fanizzi e Lukasiewicz (2008) sendo tambm o cerne da lgica de descrio probabilstica cha-
mada credal ALC (CRALC) (COZMAN; POLASTRO, 2008) que foi utilizada neste trabalho
(SANTOS et al., 2010; FENELON et al., 2010). O CRALC uma extenso probabilstica da
lgica de descrio ALC e como esta baseada em conceitos, os quais representam conjuntos de
indivduos (tais como, Planta e Animal); e papis, os quais representam relaes entre dois indi-
vduos (tais como, paiDe ou amigoDe). Tambm tem um conjunto de operadores de interseco,
unio e complemento alm de alguns quantificadores (POLASTRO, 2012).
Para a localizao robtica os mtodos que tm maior sucesso so os que utilizam
algoritmos probabilsticos, que so em geral criados sobre mtodos de filtro Bayesiano (THRUN
et al., 2005). Os filtros Bayesianos so algoritmos recursivos composto de duas etapas: a
previso e a atualizao de medidas. A localizao consiste em localizar as coordenadas de um
rob relativo ao ambiente externo que em geral representado por um mapa. O mapeamento
robtico aborda o problema de aquisio de modelos espaciais dos ambientes fsicos atravs
de robs mveis. Esse problema em geral considerado importante quando se busca um rob
mvel realmente autnomo. Apesar dos progressos significativos nesta rea, ele ainda apresenta
grandes desafios. Um problema que pode ocorrer utilizando esses algoritmos - a crena acabar
convergindo para uma posio errada causado por informaes ruidosas deixando a localizao
comprometida, em alguns casos o rob fica perdido ou toma decises que so arriscadas
integridade fsica local e do rob. Neste trabalho os mapas so mapas fornecidos para o rob, as
regies do mapa qualitativo so definidas pelo tipo de relaes percebidas entre os elementos
do domnio. Pesquisas sobre abordagens e aplicaes de localizao robtica probabilstica e
mapeamento podem ser encontradas em Thrun et al. (2005) e Thrun (2002) respectivamente.
32 Captulo 1. INTRODUO
O objetivo deste trabalho desenvolver um sistema de raciocnio espacial que seja capaz
de trabalhar com incertezas e investigar sua aplicabilidade para a interpretao de cenas em
ambientes envolvendo o movimento de veculos. Para que este objetivo seja atingido, as seguintes
tarefas foram cumpridas:
Uma lgica de raciocnio espacial qualitativo com probabilidade deve tornar um sistema
de inferncia mais robusto para tratar com ambientes reais. As teorias de raciocnio espacial
qualitativo capacitam um sistema de inteligncia artificial inferir informaes sobre o ambiente
tridimensional a partir de imagens, enquanto que tcnicas probabilsticas auxiliam no tratamento
de incertezas causadas pela falta de informao ou por informaes parciais.
Para utilizar o raciocnio espacial qualitativo com lgica de descrio probabilstica,
utilizamos parte de um domnio de trfego baseado no trabalho realizado por Hummel (2009),
a qual j havia utilizado uma lgica de descrio como um formalismo de representao do
conhecimento com raciocnio espacial para entender cena de um domnio de trfego urbano.
Investigou-se como formalizar esse domnio restrito de trfego com a lgica de descrio
probabilstica CRALC (COZMAN; POLASTRO, 2008). Neste caso tratamos do problema
restrito s informaes disponveis a partir de sensores acoplados ao veculo e do conhecimento
do domnio, inferindo uma nova informao tal como a faixa na qual o veculo estaria localizado.
Realizamos as primeiras anlises para descobrir como seria possvel combinar uma interpretao
com lgica de descrio probabilstica e o raciocnio espacial aplicveis em um rob mvel
(carro autnomo mvel) (FENELON et al., 2010; SANTOS et al., 2010). O captulo 3 contm
mais detalhes sobre a utilizao do CRALC neste ambiente. Esse domnio serviu para uma
primeira abordagem do uso de raciocnio espacial qualitativo com probabilidade.
Buscando uma aplicao com dados reais, estendeu-se com uma abordagem probabils-
tica um sistema de auto localizao previamente desenvolvido em trabalhos anteriores (SANTOS;
DEE; FENELON, 2008; SANTOS; DEE; FENELON, 2009). O sistema trata do problema re-
ferente ao rob inferir sua localizao qualitativa a partir da sua percepo visual das relaes
dos elementos alvos no ambiente. Contudo o mecanismo de inferncia lgica sofria pela falta
33
de informao e pelo rudo dos dados do sistema de viso. Sem a capacidade para lidar com
incerteza esses sistema estava a espera de um sistema de viso sem rudos ou com aplicao
somente tericas em ambientes simulados e ou extremamente controlados. Este trabalho est
dividido em duas partes em que como contribuio geral integraram sistemas de raciocnio
espacial qualitativos com mtodos de raciocnios probabilsticos.
Primeira contribuio: criar um mtodo para combinar o clculo de direes cardinais uti-
lizado em um domnio de trfego (HUMMEL; THIEMANN; LULCHEVA, 2008) com
raciocnio probabilstico usando redes Bayesianas, em particular utilizando a lgica de des-
crio probabilstica CRALC (captulo 3) (SANTOS et al., 2010; FENELON et al., 2010).
Com os estudos realizados com CRALC como contribuio constatamos alguns pontos
que so essenciais para aplicao de CRALC em um sistema robtico com raciocnio
espacial, tal como a introduo de uma hierarquia de papis que permita fazer composio
de relaes (seo 2.2.1) .
Segunda contribuio: a mais importante, na qual foi proposto e utilizado um mtodo que
combina filtro Bayesiano com as lgicas de raciocnio espacial qualitativo que tratam de
ocluso, tal como as relaes espaciais qualitativas percebidas sobre sombras ou aquelas
percebidas entre objetos. O mtodo foi aplicado em sistemas de auto localizao utilizando
dados de imagens capturadas no ambiente real pelo rob mvel P eopleBotT M (captulos
4 e 5) (FENELON et al., 2013).
Encoding spatial domains with relational Bayesian networks (FENELON et al., 2010).
extrados de imagens capturadas pelo rob mvel enquanto navegava pelo ambiente, o sistema foi
desenvolvido baseado na formalizao sobre as relaes de ocluso entre elementos do domnio
combinado com um filtro Bayesiano. Apesar das semelhanas so dois problemas distintos e no
existe uma comparao possvel entre eles sobre seus resultados.
Aydemir e Jensfelt (2012) defende que as teorias de raciocnio espaciais qualitativos, por serem
formalizados em geral em lgica de primeira ordem, so aplicveis em sistemas computacionais,
mas no so adaptveis aos sistemas robticos mveis que estejam em ambientes com incerteza.
Entretanto este trabalho mostra que as teorias de raciocnio espacial so aplicveis em robtica
combinando com tcnicas probabilsticas. Alm disso, este trabalho no est restrito somente
a relaes topolgicas: tal como o clculo de conexo de regies e suas extenses, tambm
clculos de direo e informaes de distncia foram utilizados. As incertezas so tratadas com
um filtro Bayesiano que intuitivamente mantm uma crena na continuidade das aes do rob
no mundo. Outra diferena entre nossos trabalhos que estamos aplicando na tarefa de auto
localizao qualitativa.
1.2 Organizao
O captulo 2 apresenta um breve relato do atual estado da arte e as teorias envolvidas neste
estudo (raciocnio espacial qualitativo, probabilidade Bayesiana, lgica de descrio probabils-
tica, assim como algumas tcnicas de viso computacional), procurando sempre relacionar com
os objetivos dessa investigao. O captulo 3 descreve nossas primeiras investigaes implemen-
tando um domnio de trfego formalizado em lgica de descrio probabilstica com um clculo
de direes cardinais, onde analisamos como utilizar o CRALC e como poderamos associar
probabilidades em sistemas lgicos espaciais, visando aplicao em agentes mveis autnomos.
No captulo 4, a partir das concluses derivadas dos experimentos preliminares, comeamos o
desenvolvimento de uma extenso probabilstica de um sistema de auto localizao para um
rob mvel utilizando raciocnio espacial qualitativo. O captulo 5 apresenta os resultados e
discusses a respeito do sistema de auto localizao qualitativa para um rob mvel. Enfim a
concluso e trabalhos futuros so encontrados no captulo 6.
37
2 FUNDAMENTOS
Este captulo descreve as teorias que foram utilizadas nesta pesquisa. Grande parte de
nossas investigaes envolve alguma teoria ou conceito de Raciocnio Espacial Qualitativo
(REQ)1 (seo 2.2) (STOCK, 1997), tais como: clculo sobre conexo de regies2 (seo 2.2.1)
(RANDELL; CUI; COHN, 1992), clculo sobre ocluso de regio3 (seo 2.2.2) (RANDELL;
WITKOWSKI; SHANAHAN, 2001) que so base para uma teoria mais especfica chamada
relaes qualitativas percebveis sobre sombras4 (seo 2.2.3) (SANTOS; DEE; FENELON,
2008) e o clculo de direo cardinal5 (seo 2.2.4) (FRANK, 1996). O raciocnio espacial
qualitativo utilizado por um agente munido de viso computacional para interpretao do
mundo tridimensional a partir de informaes de imagens bidimensionais (seo 2.2). A captura
de informaes ou mesmo a representao do conhecimento do mundo real tem a incerteza como
caracterstica intrnseca. Apesar de uma abordagem qualitativa ser uma tcnica que trata com
certo grau de incerteza, ainda assim em algumas situaes no possvel representar as relaes
qualitativas apropriadamente (CHEN et al., 2013).
Para tratar com incerteza as abordagens probabilsticas (seo 2.3) utilizadas foram:
as redes Bayesianas relacionais e um filtro Bayesiano. As redes Bayesianas relacionais fazem
parte do mecanismo de inferncia da lgica de descrio probabilstica Credal ALC (CRALC)
(seo 2.4) (COZMAN; POLASTRO, 2008). Tambm so abordados brevemente alguns tpicos
relacionados s tarefas propostas, tais como: localizao robtica (seo 2.5), interpretao de
imagens (seo 2.6) e viso computacional (seo 2.7).
et al. (2006) realizou pesquisas com robs interagindo com pessoas, procurando melhorar a
maneira das mquinas executarem tarefas de modo aceitvel e confivel para os humanos.
Pesquisas com foco em utilizar a percepo robtica so relatadas em Scherl e Levesque (1993)
o qual utilizou as informaes percebidas pelo rob para produzir conhecimento a partir de suas
aes, enquanto que em Santos e Shanahan (2002a) os dados coletados pelos sensores do rob
mvel serviram de base para a construo de um sistema de raciocnio espacial. Essas pesquisas
so em geral realizadas em ambientes controlados ou executando apenas tarefas especficas.
Ambientes controlados so utilizados em robtica devido ao elevado grau de incerteza que existe
em ambientes humanos dinmicos. Alguns pesquisadores acreditam que poderemos elevar a
capacidade cognitiva robtica agregando os vrios algoritmos desenvolvidos para efetuar diversas
tarefas (MCCARTHY, 2007).
x C(x, x);
x y C(x, y) C(y, x).
Assumindo a relao binria C/2 e as variveis x, y e z para regies espaciais define-se diferentes
relaes entre pares. A definio de algumas dessas relaes e suas interpretaes podem ser
vistas na Tabela 1 (RANDELL; CUI; COHN, 1992; RENZ, 2002). As relaes DC, EQ,
2.2. Raciocnio Espacial Qualitativo 39
Figura 1: Diagrama conceitual de vizinhana (CND - Conceptual Neighborhood Diagram) das relaes RCC-8.
Note a continuidade das transies topolgicas entre regies (indicadas pelas setas), as mudanas de relaes
ocorrem sempre para uma relao vizinha.
distintas a,b e c, onde, dadas informaes sobre as relaes entre a e b e entre b e c, se extrai um
conjunto de relaes possveis entre as regies a e c. A Tabela 2 uma tabela de composio
para RCC-8, onde a primeira coluna representa as relaes entre a e b (R1 (a, b)) e a primeira
linha as relaes entre b e c (R2 (b, c)). O conjunto das relaes possveis entre a e c (R3 (a, c))
esto representadas nas clulas definidas pela interseco entre a coluna de R1 (a, b) e a linha de
R2 (b, c) (RANDELL; WITKOWSKI, 2002).
Para exemplificar tanto a transitividade quanto a transio de relaes utilizaremos um
exemplo grfico (Figura 2). Considerando as relaes entre as trs regies (a, b e c) representadas
esquerda da Figura 2, onde R1 (a, b) uma relao N T P P (a, b), caso ocorra uma transio da
relao R1 (a, b) pelo diagrama conceitual de vizinhana a prxima relao seria ou EQ(a, b)
ou T P P (a, b), na Figura 2 a relao mudou para T P P (a, b), enquanto que a relao R2 (b, c)
(T P P (b, c)) permaneceu igual. Nesta mesma figura tambm est representada a transitividade
entre as trs regies (a, b e c). Pode se observar duas composies: a esquerda note que com-
posio das relaes N T P P (a, b) e T P P (b, c) resultam na relao N T P P (a, c), enquanto a
direita a composio resultante entre T P P (a, b) e T P P (b, c) so as duas relaes N T P P (a, c)
e T P P (a, c) referentes s duas possveis transies. Esses resultados esto expressos na tabela
de composio (Tabela 2).
A tabela de composio e o diagrama conceitual de vizinhana so ferramentas de
inferncia aplicveis com outros clculos espaciais. Neste trabalho o conceito de transio foi
utilizado para inferir mudana de posio em relao ao contexto onde um observador est, ou
seja, esse conceito de continuidade e vizinhana foi utilizado na criao do modelo de transio
do sistema de auto localizao (seo 4.4.4) (FENELON et al., 2013). A tabela de composio
serve para inferir uma relao entre indivduos em contextos nos quais essas relaes no so
percebidas diretamente pelos sensores. Neste trabalho, utilizamos uma tabela de composio
para inferir relaes entre um veculo e faixa da rua, das relaes entre o veculo e linha divisria,
e da faixa e a linha divisria a partir das relaes percebidas, de informaes do domnio e dos
sensores (seo 3.2) (FENELON et al., 2010).
O clculo de conexo de regies (RCC) representa as relaes mereotopolgicas entre
regies espaciais que so independentes do ponto de vista do observador. Isto diferente
do clculo de linhas visuais (lines-of-sight calculus) (GALTON, 1994) que a partir de um
ponto de vista representa as posies relativas entre pares de corpos convexos no sobrepostos.
Inspirado pelo clculo de linhas visuais foi criada uma teoria conhecida como clculo sobre
ocluso de regio (RANDELL; WITKOWSKI; SHANAHAN, 2001), a qual uma extenso
do RCC (RANDELL; CUI; COHN, 1992), proposta para representar as vrias possibilidades
de interposies entre quaisquer objetos dependendo do ponto de vista do observador. A seguir
descreve-se brevemente esta teoria.
2.2. Raciocnio Espacial Qualitativo 41
Tabela 2: Tabela de composio para o RCC-8 com o conjunto das relaes exclusivamente disjuntas possveis
R3 (a, c) entre a e c a partir das relaes R1 (a, b) e R2 (b, c).
R2 (b, c)
R1 (a, b) DC EC PO TPP TPPI EQ NTPP NTPPI
DC DC EC DC EC DC EC DC EC DC DC DC EC DC
PO TPP PO TPP PO TPP PO TPP PO TPP
TPPI EQ NTPP NTPP NTPP NTPP
NTPP
NTPPI
EC DC EC DC EC
DC EC EC PO DC EC EC PO TPP DC
PO TPPI PO TPPI
PO TPP TPP NTPP
NTPPI TPPI EQ
NTPP NTPP
PO DC EC DC EC
DC EC PO TPP DC EC PO PO TPP DC EC
PO TPPI PO TPPI
PO TPP NTPP PO TPPI NTPP PO TPPI
NTPPI NTPPI
TPPI EQ NTPPI
NTPP
NTPPI
TPP DC DC EC DC EC TPP DC EC TPP NTPP
DC EC
PO TPP NTPP PO TPP PO TPPI
NTPP TPPI EQ NTPPI
TPPI DC EC EC PO PO TPPI PO TPP TPPI TPPI PO TPP NTPPI
PO TPPI TPPI NTPPI TPPI EQ NTPPI NTPP
NTPPI NTPPI
EQ DC EC PO TPP TPPI EQ
NTTPI NTPP
NTPP DC DC DC EC NTPP DC EC NTPP
DC EC NTPP
PO TPP PO TPP
PO TPP
NTPP NTPP
TPPI EQ
NTPP
NTPPI
NTPPI DC EC PO TPPI PO TPPI PO TPPI NTPPI NTPPI PO TPP NTPPI
PO TPPI NTPPI NTPPI NTPPI TPPI EQ
NTPPI NTPP
NTPPI
Fonte Randell e Witkowski (2002).
Figura 2: Representao grfica das composies R1 (a, b) e R2 (b, c) antes e depois da transio representada
pela seta, note que o conjunto resultante R3 (a, c) so as relaes possveis (Tabela 2).
Fonte: autor.
42 Captulo 2. FUNDAMENTOS
Figura 3: Duas sequncias de imagens (da esquerda para direita) onde um cone passa em frente (sequncia
superior) e por trs (sequncia inferior) do cilindro, este um exemplo da ocluso em ao. Note na ocorrncia de
ocluso os dois objetos formam uma nica regio na imagem.
Fonte: autor.
ponto de vista. A distino formal apresentada pelas duas funes: region(x) lida como a
regio ocupada por x e image(x, ) lida como a imagem de x em relao ao ponto de vista
(RANDELL; WITKOWSKI, 2002).
Com a relao primitiva T otallyOccludes(x, y, ) define-se um evento de ocluso total
entre dois corpos, essa relao lida como "x oclui totalmente y com relao ao ponto de vista
". TotallyOccludes/3 axiomatizada como transitiva e irreflexiva (RANDELL; WITKOWSKI;
SHANAHAN, 2001). Para descrever o significado geomtrico de uma ocluso total, considere
que uma linha(p1 , p2 , p3 ) definida de modo que, os pontos p1 , p2 e p3 estejam em uma reta,
com p2 posicionado estritamente entre p1 e p3 . Ento, uma regio x oclui totalmente uma regio
y do ponto de vista se e somente se para todo o ponto p em y, existir um ponto q em x tal que
linha(, q, p) seja verdade e no exista nenhum outro ponto p0 em y e q 0 em x, com os quais
linha(, p0 , q 0 ) seja verdadeiro. Vrios axiomas que constituem o ROC sero apresentados a
seguir (RANDELL; WITKOWSKI; SHANAHAN, 2001):
Figura 5: Modelo grfico das 20 relaes bsicas do clculo sobre ocluso de regio, o ROC-20.
x y [T otallyOccludes(x, y, )
z u [[P (region(z), region(x)) P (region(u), region(y))]
T otallyOccludes(u, z, )]], (2.3)
isto , todo x tem uma parte que oclui totalmente outra parte de x. Este axioma garante que o
corpo tem profundidade.
isto , x oclui y do ponto de vista se pelo menos existe uma parte de x que oclui totalmente
pelo menos uma parte de y.
Figura 6: Estudos sobre sombra de Leonardo da Vinci. No esboo v-se representados as sombras do objeto
projetadas em outra superfcie (sombra-projetada) e no prprio objeto (sombra-prpria).
Fonte:Vinci (1970).
Figura 8: Bola na caixa. Mesmo na mesma localizao da bola em (b) e (c) percebemos posicionamentos diferentes
devido sombra.
N onOccludesDC(o, s, ) N onOccludes(o, s, )
DC(image(o, ), image(s, )), (2.9)
N onOccludesEC(o, s, ) N onOccludes(o, s, )
EC(image(o, ), image(s, )), (2.10)
do ponto de vista existe ocluso parcial da sombra s pelo objeto o conforme representado na
Figura 10b, onde objeto o no oclui a sombra s porm suas bordas esto conectadas do ponto de
vista ;
do ponto de vista existe ocluso parcial entre o objeto o e a sombra s conforme representado
na Figura 10c, onde o objeto o oclui a sombra s de modo que na imagem a sombra s aparece
2.2. Raciocnio Espacial Qualitativo 49
do ponto de vista existe ocluso parcial da sombra s pelo objeto o conforme representado na
Figura 10d, onde objeto o oclui parte da sombra s tangenciando uma das bordas da sombra s na
imagem do ponto de vista ;
do ponto de vista existe ocluso total da sombra s pelo objeto o conforme representado na
Figura 10e, onde objeto o oclui totalmente a sombra s a qual parte tangencial do objeto o na
imagem do ponto de vista ;
T otallyOccludesEQ(o, s, ) T otallyOccludes(o, s, )
EQ(image(o, ), image(s, )), (2.14)
do ponto de vista existe ocluso total da sombra s pelo objeto o conforme representado na
Figura 10f, onde objeto o oclui totalmente a sombra s a qual igual ao objeto o na imagem do
ponto de vista ;
do ponto de vista existe ocluso total da sombra s pelo objeto o conforme representado na
Figura 10g, onde objeto o oclui totalmente a sombra s a qual no tangencia o objeto o na imagem
do ponto de vista .
Alm das relaes formalizadas acima, a teoria PQRS adota a primitiva Shadow(s, o, Scr, L)
que representa a sombra s do objeto o, provocada pela fonte de luz L sobre a superfcie Scr.
50 Captulo 2. FUNDAMENTOS
Figura 10: Imagens capturadas pelo P eopleBotT M . Representando as relaes PQRS (a) NonOcclu-
desDC(o,s), (b) NonOccludesEC(o,s), (c) PartiallyOccludesPO(o,s), (d) PartiallyOccludesTPP(o,s), (e) TotallyOc-
cludesTPPI(o,s), (f) TotallyOccludesEQ(o,s) e (g) TotallyOccludesNTPPI(o,s).
(a) (b)
(c) (d)
(e) (f)
(g)
Pode-se declarar que a sombra s do objeto o a mesma regio da superfcie Scr que est
totalmente oclusa pelo objeto o do ponto de vista da fonte de luz L. O axioma que restringe a
relao Shadow/4 apresentado pela frmula (2.16) abaixo:
O axioma (2.16) diz que a sombra s do objeto o a regio na superfcie Scr que est
totalmente oclusa por o do ponto de vista da fonte de luz L, caso no exista outro objeto o0
ocluindo o do ponto de vista da fonte de luz. A partir deste formalismo podem-se provar alguns
teoremas sobre fatos do senso comum, os quais podem ser encontrados em Santos, Dee e Fenelon
(2008), Fenelon et al. (2012).
At agora as descries das relaes de ocluso foram feitas do ponto de vista da fonte
de luz. Porm, tambm possvel raciocinar sobre sombras a partir do ponto de vista de um
observador. Com o PQRS podemos inferir informaes tais como percepo de profundidade e
a localizao relativa do observador, ambas descritas em (SANTOS; DEE; FENELON, 2008;
SANTOS; DEE; FENELON, 2009). Por ser relevante a esse trabalho a seguir descreveremos
somente a localizao relativa.
Quando o observador tem dentro do seu campo visual um objeto com sua sombra
correspondente, podemos por deduo determinar a posio do observador em relao ao objeto
e a fonte de luz, ou seja, sua localizao relativa. possvel definir relaes entre sombra e
objeto a partir do ponto de vista de um observador. Essas relaes dependem da posio em que
o observador se encontra, portanto esta informao pode ser utilizada em um mecanismo de
auto localizao do rob. A partir da descrio de ocluso da sombra, cinco regies podem ser
observadas e definidas pelas linhas de viso entre a fonte de luz L, o objeto o e sua sombra s,
como representado na Figura 11b.
Para definir formalmente esta localizao, assumimos a relao located(r, , o, s) que
representa um observador localizado na regio r em relao ao objeto o e a sombra s. As
relaes so definidas a partir da sombra projetada pela parte superior do objeto (Figura 11a).
O termo r(r 1, 2, 3, 4, 5) representa as regies mostradas na Figura 11b, ento para definir a
localizao em cada regio temos que (SANTOS; DEE; FENELON, 2009):
Figura 11: (a) Um objeto com sua sombra conectada e projetada numa superfcie irregular, destaque para a parte
da sombra relativa a parte superior do objeto; (b) Regies distintas expressas pela observao do objeto e sua sombra,
definidas pelas linhas de viso.
(a) (b)
2
l
1
3
s 4
O
5
L
s O
a frmula (2.17) define que um observador na regio r = 1 observa que: o no oclui e est
desconectado de s, e s no sombra de (Figura 12a);
a frmula (2.18) define que um observador na regio 2 observa que: o no oclui e est
externamente conectado de s, e s no sombra de (Figura 12b);
a frmula (2.19) define que um observador na regio 3 observa que: o parcialmente oclui e
sobrepe s, e s no sombra de (Figura 12c);
a frmula (2.20) define que um observador na regio 4 observa que: o oclui totalmente s e este
parte tangencial de o, e s no sombra de (Figura 12d);
a frmula (2.21) define um observador na regio 5 observa que: o oclui totalmente s e este
parte no tangencial de o, e s no sombra de (Figura 12e).
2.2. Raciocnio Espacial Qualitativo 53
Esta formalizao das relaes entre objetos e suas sombras do ponto de vista de um
observador facilita caracterizar qualitativamente o espao em volta do objeto. Iremos analisar
cada regio com fotos capturadas pelo P eopleBotT M no laboratrio do centro universitrio da
FEI. As imagens mantm o foco no objeto e na sua sombra projetada na parede enquanto o ponto
de vista do observador ser deslocado da regio 1 at a regio 5 (Figura 12).
Na Figura 12a observada uma sombra completa no oclusa pelo objeto onde ambos
(sombra e objeto) esto desconectados (N onOccludesDC) caracterizando a regio 1. Quando o
observador se desloca em direo regio 2, a sombra parece se deslocar ao encontro de seu
objeto. No momento em que o deslocamento do observador provoca (na imagem) o encontro
das bordas do objeto e sua sombra, o observador se encontra na regio 2, quando nesta regio
o objeto no oclui a sombra mas ambos esto prximos, deste modo podemos consider-los
externamente conectados (N onOccludesEC) (Figura 12b).
Na Figura 12c o observador est posicionado na regio 3, pois a sombra est parcialmente
oclusa pelo objeto, e na imagem o objeto aparece sobrepondo a sombra parcialmente. A regio
4 tem sua superfcie definida pela linha tangencial fonte de luz e ao objeto, nela a sombra
est a ponto de desaparecer. Note pela Figura 12d que a sombra est oculta pelo objeto na
regio 4, a qual a fronteira onde a sombra ir desaparecer por completo se o agente estiver se
movimentando na direo da regio 5 (Figura 12e), ou reaparecer se estiver indo na direo
da regio 3 (T otallyOccludesT P P I) (Figura 12c). Na regio 5 estamos no mesmo campo de
viso da fonte de luz, nesta regio a sombra est projetada numa superfcie totalmente oclusa
pelo objeto e, portanto, no possvel v-la (T otallyOccludesN T P P I) (Figura 12e).
Toda a teoria do PQRS baseada no fato de que as sombras so corretamente relacionadas
aos objetos. Portanto relacionar uma sombra com o objeto que a provocou necessrio para a
aplicao correta da teoria, pois uma inferncia com a sombra de outro objeto conduz ao erro.
Uma soluo automtica (parcial) para este problema de correspondncia proposta a seguir.
Uma sombra pode estar ou no conectada ao objeto que a projetou. Neste trabalho
foram desconsiderados os casos em que um objeto suspenso no ar ter a sua sombra projetada
desconectada do mesmo. Para formalizao de situaes em um ambiente de laboratrio usamos
uma hiptese simplificadora de que em nossos experimentos o objeto est imvel sobre o cho. A
sombra sempre estar conectada ao objeto que a provocou. Desta maneira, nas imagens, as regies
que representam o objeto e sua sombra esto externamente conectadas. A correspondncia entre
o objeto e sua sombra foi formalizada com base no PQRS, porm, vamos ver antes algumas
restries para a formalizao.
A frmula 2.16 garante que somente existe sombra s se houver o objeto o, uma superfcie
Scr e uma fonte de luz L, alm desses elementos outras restries devem ser observadas, so
elas:
54 Captulo 2. FUNDAMENTOS
Figura 12: Como a sombra aparece quando somente o observador altera sua posio para: (a) regio 1, (b) regio
2, (c) regio 3, (d) regio 4 e (e) regio 5 representadas no mapa da Figura 11b
(a) (b)
(c) (d)
(e)
Fonte:autor.
2.2. Raciocnio Espacial Qualitativo 55
O objeto sempre est externamente conectado (EC) com sua sombra. , portanto,
conveniente representar o objeto em base e topo: Base(x, z, ) significa x base de z do ponto
de vista de e T op(y, z, ) significa y topo de z do ponto de vista de . Base/3 obedece
aos seguintes axiomas:
x Base(x, x, ), (2.22)
isto , caso uma parte x seja a base de y est no poder ser o topo de y;
isto , qualquer parte z de x ser uma base de y tambm e no existe nenhuma parte u de x que
ser o topo y;
isto , que a base x e topo z do objeto y aparecem na imagem como parte de y e externamente
conectados. Assim para definir que determinada sombra s corresponde ao objeto o utilizamos a
frmula 2.28:
e que tanto a base b quanto a sombra s estejam ambas sobre a mesma superfcie.
Figura 13: Imagens capturadas no laboratrio, onde podemos aplicar a frmula de correspondncia de sombra,
note somente a sombra do objeto est externamente conectada sua base e mais distante da fonte de luz.
(a) (b)
(c)
Fonte: autor.
Figura 14: Por causa das sombras podemos inferir que h outro objeto totalmente ocluso pelo balde.
Figura 15: Representao da projeo em quadrante, sendo os elementos representados como ponto (direito) e
regio (esquerda).
informao sobre outra varivel aleatria X, atravs de probabilidades condicionais (eq. (2.29)):
A regra de Bayes relaciona uma probabilidade condicional sua inversa de modo que:
P (y|x)P (x)
P (x|y) = . (2.30)
P (y)
A regra de Bayes tem um papel importante em inferncia probabilstica em geral. Pois conside-
rando que x uma quantidade que se quer inferir a partir de y, a probabilidade P (x) referente
a distribuio de probabilidade a priori, e y chamado de dado de informao (como dados
dos sensores). A probabilidade P (x|y) a distribuio de probabilidade posterior sobre X. A
regra de Bayes oferece um modo conveniente para calcular a probabilidade posterior P (x|y)
utilizando a verossimilhana P (y|x) e a probabilidade a priori P (x). Ou seja, para inferir x a
partir do dado y do sensor, a regra de Bayes permite especificar qual a probabilidade dos dados y
assumindo que x ocorra. Em robtica, a probabilidade P (y|x) frequentemente criada como um
modelo que descreve com algum nvel de abstrao como um determinado estado da varivel X
causa o valor de sensor Y (THRUN et al., 2005).
Tambm importante notar que o denominador na regra de Bayes no depende de x,
assim o fator P (y)1 uma constante para qualquer valor de x na probabilidade posterior P (x|y).
Por isso a constante pode ser escrita como um fator de normalizao, que em geral denominado
como :
P (x|y) = P (y|x)P (x). (2.31)
Neste trabalho usaremos o smbolo para indicar que o resultado foi normalizado para 1.
Podemos condicionar a regra de Bayes com uma varivel aleatria arbitraria Z = z,
como na equao (2.32):
P (y|x, z)P (x|z)
P (x|y, z) = . (2.32)
P (y|z)
Tambm podemos definir independncia condicional atravs da igualdade.
Neste trabalho, utilizamos dois modelos: filtros Bayesianos e redes Bayesianas relacionais. A
seguir comearemos descrevendo brevemente o filtro Bayesiano.
Para o modelo de sensor, as variveis de medidas zt podem depender tanto das variveis
de evidncias anteriores z0:t1 quanto da varivel do estado atual xt , mas qualquer estado atual
deve ser o suficiente para gerar o valor atual do sensor. Deste modo, aplicando a suposio de
Markov temos a equao (2.36):
assim, P (zt |xt ) o modelo de sensor. Em nosso trabalho as evidncias so as relaes espaciais
qualitativas percebidas a partir das imagens, por isso nosso modelo de sensor chamado de
modelo de imagem.
Um filtro Bayesiano tem duas etapas: a previso (bel(xt ) ) e a atualizao das medidas
(bel(xt )) (THRUN et al., 2005). Na etapa de previso a crena sobre o estado atual de um rob
condicionado ao controle u0:t e todas as evidncias anteriores z0:t1 sem a evidncia medida zt
(eq. (2.37)):
Note que na previso de medidas a medida do estado atual no foi considerada, ao incluir a
medida do estado atual temos a segunda etapa que a atualizao das medidas (bel(xt )) onde
2.3. Modelos Probabilsticos 61
o estado atual previsto ponderado pela probabilidade de uma atuao de controle ut e uma
medida zt realizada neste estado xt (eq. (2.38)):
xt1
P (xt |z0:t , u0:t ) = P (zt |xt ) P (xt |xt1 , ut )P (xt1 |z0:t1 , u0:t1 )
X
xt1
Neste trabalho o filtro Bayesiano foi utilizado na tarefa de auto localizao qualitativa do
rob. As evidncias medidas so as relaes espaciais qualitativas percebidas atravs de imagens,
e o estado representa a regio onde o rob est localizado, e no se utilizou a varivel de controle
do rob. A prxima seo tratar das redes Bayesianas relacionais.
rede Bayesiana, pode-se raciocinar sobre o domnio, inferindo informaes quando observado
o valor de alguma varivel. O processo de inferncia calcula a distribuio de probabilidade
posterior, para um conjunto de ns de consulta, dado os valores para alguns ns de evidncia
(KORB; NICHOLSON, 2003).
Uma rede Bayesiana relacional para um vocabulrio S dada por uma rede Bayesiana
que contm um n para toda relao r S. Os ns para relaes n-aria r S esto associados
com uma frmula de probabilidade Fr (x1 , . . . , xn ) sobre todos os smbolos dos pais de r (P a(r))
(JAEGER, 1997). A frmula de probabilidade indica como calcular a probabilidade de r(v) para
qualquer elemento v no domnio D. Quando uma inferncia requerida para alguma relao r(v),
ou seja, uma requisio para a probabilidade de r(v) condicionada por algum evento observado,
uma rede Bayesiana proposicional gerada; cada n desta rede representa a instanciao de uma
relao (COZMAN et al., 2004). O mtodo de redes Bayesianas relacionais foi desenvolvido por
Jaeger (1994b) e est incluso no pacote de domnio pblico do sistema Primula 6 (JAEGER et
al., 2006). Redes Bayesianas relacionais fazem parte do mecanismo de inferncia da lgica de
descrio probabilstica Credal ALC descrita a seguir.
1995; KOLLER; PFEFFER, 1998; JAEGER, 1997; POOLE, 1993; NGO; HADDAWY, 1997;
WELLMAN; BREESE; GOLDMAN, 1992).
Em particular, tem havido esforo significativo para combinar construes lgicas com
redes Bayesianas ou campos de Markov (GETOOR; TASKAR, 2007; MILCH; RUSSELL, 2007).
Essa abordagem pode tambm ser encontrada em vrias lgicas de descrio probabilsticas.
A lgica P-CLASSIC usa uma coleo de redes Bayesianas como semntica para qualquer
conjunto de frmulas (KOLLER; PFEFFER, 1997). Novamente, probabilidades so impostas
sobre o domnio e asseres no podem ser associadas a probabilidades. O mesmo ocorre com a
Tiny Description Logic de Yelland (1999), com a linguagem BayesOWL de Ding e Peng (2004),
Ding, Peng e Pan (2006), e com a lgica proposta por Staker (2002).
Uma abordagem diferente usada por Laskey e Costa (2012): sua proposta usar
fragmentos de redes Bayesianas para representar certos blocos fundamentais em lgica de
primeira-ordem, e combinar esses blocos conforme a terminologia de interesse. Essa abordagem
foi bastante geral, com incluses e asseres probabilsticas no entanto a dificuldade que um
algoritmo de inferncia no foi derivado. Uma abordagem similar foi adotada por Nottelmann e
Fuhr (2004), Nottelmann e Fuhr (2006), os quais partem de uma verso probabilstica de Prolog
e a especializam para uma lgica de descrio restrita.
As lgicas de Laskey e Costa (2012), Nottelmann e Fuhr (2004), Nottelmann e Fuhr
(2006), so relevantes por usarem, diferentes das demais, uma semntica baseada em proba-
bilidades sobre interpretaes. Isso significa que, em lugar de impor probabilidades sobre o
domnio, a lgica impe probabilidades sobre as possveis interpretaes I. Uma semntica
baseada em probabilidades sobre interpretaes pode facilmente lidar com probabilidades como
P (C(a)|D(b)); para calcular P (C(a)|D(b)), devemos calcular a probabilidade de encontrar
C(a) e D(b) entre todas as interpretaes para as quais vale D(b).
Uma semntica deve ser precisa para evitar o quanto possvel problemas de ambiguidade
na base de conhecimento (HUMMEL, 2009). Uma semntica baseada em interpretaes pode
interpretar uma incluso probabilstica (form. (2.41)), de pelo menos duas maneiras. Primeiro,
como uma afirmao probabilstica sobre cada indivduo (form. (2.42)). Segundo, como uma
afirmao sobre validade de sentenas (form.(2.43)):
P (C|D) [, ]; (2.41)
x : P (C(x)|D(x)) [, ]; (2.42)
I(C) = D\I(C),
P (C) [, ], (2.44)
P (C|D) [, ], (2.45)
P (r) [, ]. (2.46)
x D : P (C(x)|D(x)) [, ], (2.48)
(x, y) D D : P (r(x, y)) [, ]. (2.49)
Figura 17: Exemplo de redes e tabelas de probabilidades condicionais geradas pelos construtores lgicos
um valor deve ser definido para est probabilidade P (A|C) = (Figura 16(b)). Seguindo esse
raciocnio na Figura 17 apresenta um exemplo das distribuies de probabilidades condicionais
(DPC, definido anteriormente) para P (E|A t B) = 0.8, F A t B e G v A t B onde as
interrogaes so probabilidades desconhecidas cujo valor deve ser definido.
As restries existenciais r.C so escritas na forma de ni=1 ri Ci . Ou seja, como
S
r(x, y).C(y) y r(x, y) u C(y) que pode ser escrita como uma disjuno de conjunes
((r(x, 0) u C(0)) t (r(x, 1) u C(1)) t . . . t (r(x, n) u C(n))). A representao Bayesiana
equivalente A(x) v r(x, y).C(y) a P (A(x)|r(x, y) u C(y)) = e P (A(x)|(r(x, y) u
C(y))) = 0 (Figura 18).
Para as restries universais r.C so escritas na forma ni=1 ri Ci . Ou seja, como
T
r(x, y).C(y) y r(x, y) C(y) y r(x, y) t C(y) que pode ser escrito como uma
conjuno de disjunes ((r(x, 0) t C(0)) u (r(x, 1) t C(1)) u . . . u (r(x, n) t C(n))). A
representao Bayesiana equivalente A(x) v r(x, y).C(y) P (A(x)|r(x, y) t C(y)) =
e P (A|(r(x, y) t C(y))) = 0 (Figura 19). Em ambos o valor da probabilidade que deve
ser definido. Esse o modo como o CRALC traduz as asseres lgicas de conceitos e papis, e
68 Captulo 2. FUNDAMENTOS
foi utilizado como base para a construo manual de uma rede Bayesiana relacional com papis
de relaes de direes cardinais neste trabalho (seo 3.3.2).
Como exemplo considerando uma terminologia com conceitos A, B, C e D. Supondo
que:
P (A) = 1 ,
B v A,
P (D|r.A) = 2 ,
C v B t r.D.
Figura 20: Exemplo grfico de uma rede gerada a partir de uma terminologia , e sua caracterstica para um
domnio com dois indivduos [a, b] .
os papis (relao entre dois indivduos). A partir das definies dos conceitos primitivos e
dos papis, novos conceitos podem ser criados. Ou seja, com esses conceitos uma hierarquia
de objetos pode ser formada. Um domnio pode ser definido a partir dos conceitos anteriores
e das restries. Em Polastro et al. (2010) uma ontologia definindo domnios de ambientes
foi desenvolvida com CRALC. Uma formalizao similar foi utilizada no reconhecimento de
objetos baseado em contexto (FENELON-PEREIRA; SANTOS; COZMAN, 2012).
mesma ideia foi aplicada a um domnio da RoboCup e est relatada em (WAGNER; VISSER;
HERZOG, 2004).
Para a construo de mapas qualitativos Santos, Dee e Fenelon (2008) apresentou a teoria
PQRS em que o mapa qualitativo divide o espao em cinco regies baseado em uma formalizao
lgica de ocluso e observao de sombras, Fogliaroni et al. (2009) props um modelo de
visibilidade e ocluso de objetos para gerar as regies em espao navegvel. McClelland,
Campbell e Estlin (2013) introduziu um mtodo para a construo de mapa utilizando as posies
relativas dos pontos de referncia. Estes mtodos so geralmente baseados em algum tipo de
conceptualizao humana do espao, alguns deles fundamentados em descobertas recentes em
psicologia cognitiva (WOLTER; FREKSA; LATECKI, 2008). No entanto, eles so incapazes
de lidar com o rudo do sensor, o que limita a sua aplicabilidade a domnios bem controlados e
deterministas. Um panorama mais completo de representaes qualitativas para localizao do
rob apresentado em (WOLTER; FREKSA; LATECKI, 2008).
Os mtodos de localizao de maior sucesso em robtica so baseados em algoritmos
probabilsticos. Algoritmos de localizao probabilsticos so geralmente definidos como filtros
Bayesianos (THRUN et al., 2005). Como j vimos, na seo 2.3.1, o filtro Bayesiano um
algoritmo recursivo que consiste em duas partes: a previso e atualizao das medidas. Esta
definio bsica resume obras sobre localizao de Markov (FOX; BURGARD; THRUN, 1999)
e os procedimentos de localizao que utilizam filtros de Kalman (CHEN, 2012). Este ltimo
um caso especial da localizao de Markov, onde os modelos de sensores de movimento
so funes Gaussianas lineares. Mtodos conhecidos como algoritmos de Monte Carlo (DEL-
LAERT et al., 1999) estendem a localizao bsica de Markov por aplicao de um filtro de
partculas para representar a distribuio dos estados possveis . Dado o movimento do rob as
partculas so atualizadas de acordo com a previso do prximo estado e so redimensionadas de
acordo com a percepo do agente. Essas ideias tm uma alta aceitao no campo da robtica
(DELLAERT et al., 1999). Portanto, um levantamento completo das obras recentes relacionadas
com algoritmos de localizao probabilsticos uma tarefa difcil. Pesquisas das abordagens
iniciais para localizao robtica probabilstica podem ser encontrados em Thrun (2002), Thrun
et al. (2005).
este sistema foram posteriormente exploradas por Schroeder e Neumann (1996), e revisitadas e
incorporadas em lgica descritiva por Neumann e Mller (2008) na dcada seguinte.
Em Shanahan (1996), um formalismo lgico proposto para definir rigorosamente a
transio das informaes provenientes dos sensores de um rob mvel para smbolos represen-
tando a existncia, localizao e a forma dos objetos observados. Essa proposta, porm, trata
da interpretao de cenas observadas de um ponto de vista global, em que os objetos sempre
permanecem visveis. Por outro lado, os trabalhos reportados em Santos e Shanahan (2002b),
Santos e Shanahan (2003), Santos (2007) consideram mudanas em um ambiente dinmico,
representado a partir de um ponto de vista egocntrico.
Partindo de princpios anlogos, Hazarika e Cohn (2002) descrevem um sistema para
a assimilao de cenas utilizando o conceito de histrias espaos-temporais (isto , regies
espaos-temporais representando o desenvolvimento temporal de relaes topolgicas entre
objetos fsicos). Esse modelo baseado em uma proposta anterior para a construo automtica
de modelos de eventos a partir de informaes visuais (FERNYHOUGH; COHN; HOGG,
2000). O trabalho proposto em Bennett, Cohn e Magee (2005) avalia mltiplas possibilidades de
histrias para explicar uma dada sequncia de imagens, e por um critrio de votao elege ao
final a histria mais consistente com a interpretao da sequncia. Em contraste utilizao de
histrias, em Santos et al. (2008) aplica-se um formalismo de aes, baseado em uma lgica de
processos (BONNER; KIFER, 1994) cuja semntica espelha o processo de transies de estados
ocorrido nas observaes dos objetos em cenas dinmicas.
Pesquisas na rea de avaliao de sequncias de imagens (image sequence evaluation
(NAGEL, 2000)) utilizam-se de algumas definies de raciocnio probabilstico, porm, por no
mencionarem formalismos lgicos, sofrem com a falta de definies rigorosas de semntica e
mtodos de inferncias. Neste trabalho um formalismo em raciocnio espacial qualitativo foi
utilizado para extrair das imagens capturadas por um rob informaes espaciais que possibilita
inferir a localizao do rob enquanto navega pelo ambiente. A sequncia de imagens foi anali-
sada com filtro Bayesiano utilizando informaes das relaes espaciais do domnio (captulo 4)
(FENELON et al., 2013).
Em um cenrio de trfego, por exemplo, o reconhecimento de faixa uma tarefa realizada
por imagens. As pesquisas em reconhecimento de faixa tm se concentrado tradicionalmente,
em estimar as propriedades geomtricas das faixas em frente do veculo utilizando equipamentos
de imagens (MCCALL; TRIVEDI, 2006). Em Hummel (2009) encontramos uma tentativa de
inferir propriedades funcionais das faixas, tal como a direo permitida da rua (por exemplo: ir
para cima ou para baixo, relativo a um sistema de coordenadas fixo), a permisso de mudar de
direo, ou interao com outros veculos. Avaliao destes dados funcionais para todas as faixas
so realizadas utilizando lgica de descrio e raciocnio espacial a partir dos dados coletados
de sensores on-board no veculo (HUMMEL, 2009). Neste trabalho, parte desse domnio foi
utilizado para formalizar com CRALC um algoritmo capaz de inferir em qual faixa o veculo
72 Captulo 2. FUNDAMENTOS
estava localizado e quais as mos de direo de todas as faixas (SANTOS et al., 2010; FENELON
et al., 2010). A seguir falaremos brevemente das tcnicas de viso computacional utilizadas neste
trabalho.
Figura 21: Representao grfica do cubo de cores RGB, o cone da esquerda representa como uma cor(80,200,130)
est localizada neste sistema cartesiano.
Fonte: http://4.bp.blogspot.com/_7YvslLFdkCI/TO44RD7Q24I/AAAAAAAAAFs/MiAsTPjSNTA/
s1600/450px-HSV_Color_Cone.png ltimo acesso em 29/01/2014.
alterao de tonalidade de cor, como exemplo, a cor rosa um vermelho com uma saturao
baixa. A intensidade ou valor V varia no eixo vertical do cone e representa o brilho, variaes
em V so percebidas como sombreamento, quando o valor de V zero, a imagem aparece como
preto, independente da intensidade dos canais de cromaticidade (GONZALEZ, 2001; SHAPIRO;
STOCKMAN, 2001).
Uma consequncia destes canais de informao em HSV que eles so ideais para
o desenvolvimento de algoritmos, pois a separao em canais facilita a aplicao de filtros
para a separao de caractersticas (GONZALEZ, 2001; SHAPIRO; STOCKMAN, 2001). A
transformao de um modelo de cor RGB para HSV e vice-versa no linear, por brevidade
no detalharemos sua matemtica. Em nosso trabalho as imagens capturadas em RGB foram
convertidas para HSV, por terem caractersticas teis para segmentar imagem: com sombras
utilizamos informaes dos canais de intensidade V e saturao S; e com as caixas coloridas
usamos as informaes dos canais de matiz H e saturao S. A tcnica principal utilizada para
separar as informaes foi o filtro de limiar.
74 Captulo 2. FUNDAMENTOS
Figura 24: Representao grfica da dilatao e da eroso com uma matriz 3x3 com elemento estruturante E.
f 2 f 1
mag(f ) = [( ) + ( )2 ] 2 . (2.51)
x y
Os operadores para deteco de bordas que utilizam gradientes so Sobel, Prewitt, Laplace,
Canny. Mais detalhes sobre estes detectores de borda podem ser encontrados em (GONZALEZ,
2001; SHAPIRO; STOCKMAN, 2001).
76 Captulo 2. FUNDAMENTOS
Figura 25: Exemplo da aplicao do componente conectado, a partir da imagem original (esquerda) um filtro
limiar e morfolgico aplicado (meio) o resultado na imagem com grupos de mesmo valor (representado pela cor).
Fonte: autor.
Primeira Contribuio
79
Figura 26: Representao grfica do cenrio de trfego (mo francesa). (a) Representao da rua, faixa, e linhas
divisrias. (b) Representao do veculo no cenrio.
(a) (b)
Os dados do sensor de vdeo tm maior grau de incerteza. Este sensor consegue obter
poucas informaes das faixas adjacentes quela em que o veculo est. Uma das razes para tal
fato porque o campo de viso que est frente do carro tem um ponto cego sobre grande parte
das faixas adjacentes. Alm disso, as linhas divisrias de faixa, as marcaes no cho (como
setas de direo) e sinais de trnsito podem no aparecer na imagem devido ocluso causada
por outros veculos. Contudo ocluso no ser um problema que iremos tratar neste domnio.
Algumas propriedades no so explicitamente dadas na forma de smbolos, mas precisam
vir do contexto de um motorista humano (tal como a regra de trnsito da mo-direita). Estas
observaes so refletidas pelas entradas dos sensores disponveis. Os sensores disponveis para
resolver a tarefa aqui proposta so:
Figura 27: (a) Cena Original. (b) Exemplo dos dados dos sensores para o cenrio da cena original.
(a) (b)
Tabela 3: Matriz de confuso do sensor de captura de imagem em que colunas representam o tipo de linha divisria
real enquanto que as linhas representam como a linha divisria foi classificada pelo sistema.
GPS - este sensor informa a rua em que o veculo est, assim como define a direo em que ele
se desloca. As direes so discretizadas como going up ou going down relativo ao
sistema de coordenadas da rua (HUMMEL, 2009).
Mapa digital - este sensor informa quantas faixas a rua tem e se esta uma rua de mo nica
ou de mo dupla. A Tabela 4 representa a matriz de confuso com a taxa de acerto das
informaes desse sensor.
Tabela 4: Matriz de confuso dos valores de probabilidade de resposta do sensor mapa digital em que colunas
representam o tipo de rua enquanto que as linhas representam como a rua foi classificada pelo sistema.
Mapa digital:
Classificao da rodovia
Mo nica Duas mos
e SolidDivider (linha contnua) (form. (3.2)), e o conceito Vehicle (veculo) definido como
GoingUp (subindo a rua) ou GoingDown (descendo a rua) (form.(3.3)) :
A taxonomia dos papis consiste das relaes do clculo de direes cardinais (CDC)
(seo 2.2.4). Definimos um CDC inspirado no formalismo proposto em Ligozat (1998), onde
objetos espaciais so pontos em um espao bidimensional e as direes cardinais entre dois
objetos A e B so definidas como duas projees de uma linha reta de A para B: uma no eixo
Sul-Norte (Down-Up) e outra no eixo Oeste-Leste (left-right).
Considerando que o nosso domnio no tem cruzamento, somente utilizamos trs das
nove relaes bsicas de direo cardinal: leste (east (e)), oeste (west (w)) e igual (equal
(eq)). Vale informar que a relao eq representa o fato de um veculo estar localizado em uma
determinada faixa. Deste modo o conceito cdc definido como a unio dos papis disjuntos
e, w, eq (frmulas (3.9) e (3.10)) abaixo:
cdc e t w t eq (3.9)
disjoint(e, w, eq) (3.10)
Lane ou a leste existe uma linha divisria tracejada DashedDivider e uma faixa Up. De modo
semelhante, a frmula (3.12) define que GoingDown est dentro do conjunto onde a oeste do
veculo existe uma linha divisria contnua SolidDivider e no existe nenhuma faixa Lane, ou a
oeste existe uma linha divisria tracejada DashedDivider e uma faixa Down.
As frmulas (3.13) e (3.14) referem-se s linhas divisrias, as quais se situam nas bordas
das faixas. Neste cenrio um DashedDivider uma linha tracejada que separa faixas com
mesma mo de direo, enquanto um SolidDivider uma linha contnua que separa faixas com
direes opostas ou indica a borda da pista.
Os sensores que equipam o veculo so conceitos que vamos adicionar a nossa T Box
como subclasses que define Sensor (form. (3.17)). A frmula (3.18) define o sensor de
classificao de linha divisria SensedDashedDivider pela classificao da faixa detectada
(SensedDashedDivider ou SensedSolidDivider).
Sensor SensedOnOneWayRoad t
SensedOnTwoWayRoad t SensedDivider (3.17)
SensedDivider SensedDashedDivider t SensedSolidDivider (3.18)
P (DashedDivider|SensedDashedDivider) = 0, 93 (3.19)
P (SolidDivider|SensedDashedDivider) = 0, 07 (3.20)
P (DashedDivider|SensedSolidDivider) = 0, 20 (3.21)
P (SolidDivider|SensedSolidDivider) = 0, 80 (3.22)
GPS: o veculo apresentado como um indivduo v e o GPS informa que v est subindo a
rua (GoingUp), a qual deve ter pelo menos uma faixa com direo Up, assumindo que o
motorista sempre dirija na direo correta.
v : Vehicle
v : GoingUp
Mapa Digital: mostra que v est dirigindo em uma via de mo dupla ou de mo nica; e
informa o nmero de faixas (neste contexto sempre trs faixas). As faixas so apresentadas
como indivduos l1 , l2 , l3 , o menor nmero, por conveno, corresponde faixa mais a
leste.
v : SensedOnTwoWayRoad
Lane = {l1 , l2 , l3 }
(l1 , l2 ) : e
(l2 , l3 ) : e
Cmera de vdeo: uma linha divisria tracejada foi reconhecida e classificada pelo sensor
e est a leste de v:
d1 : SensedDashedDivider
(d1 , v) : e
Figura 29: Domnio de trfego e todas as situaes possveis para o veculo que esteja dentro das regras.
Tabela 5: Tabela com oito estados dos sensores indicando as dozes possibilidades de estado do veculo conforme
representado na Figura 29. Com as coordenadas mudando relativas ao sentido de deslocamento do carro.
OnOneWayRoad OnTwoWayRoad
SolidDivider DashedDivider SolidDivider DashedDivider
L1 0 1 0 0
L2 0 1 0 1
GoingDown
L3 1 0 2 0
L1 1 0 2 0
L2 0 1 0 1
GoingUp
L3 0 1 0 0
Fonte: autor.
Figura 30: Rede Bayesiana formada com conceitos e papis embutidos no banco de conhecimento. Todos os ns
em azul so evidncias observadas pelos sensores.
Quando um conceito definido por disjuno exclusiva, como na frmula (3.4), isso
poderia gerar um ciclo, que no permitido nas redes Bayesianas. Assim sendo, nesta abordagem
as disjunes exclusivas tal como disjoint(A, B, C) foram representadas utilizando declaraes
como A v C e B v A u C. Essa representao foi aplicada para as disjunes exclusivas
referentes: a frmula (3.7); a resposta do sensor de linhas divisrias, para garantir a disjuno
exclusiva da frmula (3.6); e para os conceitos Onli. Mais algumas adaptaes realizadas na
ontologia apresentada na seo 3.2 foram:
Tabela 6: Resposta da rede Bayesiana representada na Figura 30 para a primeira questo: qual faixa tem maior
probabilidade do carro estar localizado. As evidncias referentes aos dados dos trs sensores (A) esto expressas
nas trs primeiras colunas.
1. Em qual faixa (li) o veculo (v) tem a maior probabilidade de estar? Essa inferncia dada
por argmaxli P ((v : Onli)).
2. Qual a direo de cada faixa? Por exemplo, qual a probabilidade para cada faixa li de ter o
sentido de direo descendo Downli? Essa inferncia dada por i : P (li : Downli).
Consultando a rede Bayesiana da Figura 30 para os oito estados possveis dos trs
sensores, obtivemos as respostas para as questes 1 e 2. A Tabela 6 apresenta a resposta sobre
qual a provvel faixa na qual o veculo v est, enquanto a Tabela 7 apresenta a resposta sobre o
sentido de direo da faixa.
A ltima coluna da Tabela 6 mostra as faixas na qual o veculo s provavelmente est
(argmaxli P ((v : Onli))), dado as evidncias A dos trs sensores representadas nas trs primeiras
colunas. Cada sensor indica uma de duas respostas mutuamente exclusivas, assim a primeira
coluna representa os dados do sensor GPS (GoingUp) com a informao de direo em que o
carro se movimenta. Na coluna seguinte esto os dados do mapa digital (SensedTwoWayRoad)
indicando se uma rodovia de mo nica ou uma rodovia de mo dupla. Enquanto que na terceira
coluna esto os dados da cmera (SensedDashedDivider) que faz uma classificao de linha
divisria como linha contnua ou linha tracejada.
A primeira linha da Tabela 6, por exemplo, representa o estado onde o GPS indica que
o carro est descendo a rua, e o mapa digital indica que rua de mo nica, e o sistema de
viso classifica a linha divisria como linha contnua. Dado estas evidncias o n Onl3 tem a
3.3. Estratgias para Soluo da Tarefa 91
Tabela 7: Resposta da pergunta dois a partir da rede Bayesiana da Figura 30: a probabilidade para a direo de a
faixa ser Down dado s evidncias A (expressas nas seis primeiras colunas).
Figura 31: Exemplo de trs cenrios de trfego, onde o carro est descendo uma via de mo nica.
(a) (b) (c)
maior probabilidade entre todos ns Onli da rede Bayesiana (Figura 30). Na Figura 31c temos
uma ilustrao desde caso. Na segunda linha da Tabela 6, tanto o GPS quanto o mapa digital
continuam como descritos anteriormente, contudo a viso mudou e agora percebe uma linha
tracejada. Neste caso existem duas hipteses com igual probabilidade 1 representadas nas Figuras
31a e 31b, as quais mostram um veculo na faixa l1 e na faixa l2 respectivamente. Os outros
casos na Tabela 6 so anlogos. A Tabela 6 tem alguns casos em que o sistema responde duas
em vez de um faixa, isso devido ao fato de termos nesta configurao somente oito estados de
sensores para doze estados deste domnio. Os resultados so os esperados quando comparamos
com a Tabela 5.
A Tabela 7 tem os valores de probabilidade da direo permitida em cada faixa li, dado
as evidncias representadas nas trs primeiras colunas. Tomando como exemplo a ltima linha, a
probabilidade maior para Upl1, Upl2 e Downl3, as quais so consistentes com as evidncias
de que o veculo est subindo uma rua de mo dupla e percebe uma linha tracejada. Para a outra
configurao das evidncias as direes de cada faixa so dadas de modo similar nesta tabela.
92 Captulo 3. RACIOCNIO ESPACIAL QUALITATIVO COM LGICA DE DESCRIO PROBABILSTICA
Figura 32: Rede Bayesiana relacional representando um domnio de trafego com papis e indivduos representando
veculo, faixas, e linha divisria.
Nesta abordagem, focamos no clculo de direo cardinal (cdc) para determinar em qual
faixa o veculo est localizado. Utilizamos uma ferramenta de raciocnio espacial qualitativo a
tabela de composio criando uma tabela de composio para o cdc deste domnio (Tabela 8). A
Figura 33 refere-se tabela de composio (Tabela 8) representada como uma rede Bayesiana.
Essa rede foi parte do estudo para verificar como fazer inferncias em uma rede Bayesiana
utilizando as informaes de transitividade das relaes observadas entre trs indivduos. A
partir das consideraes das caractersticas do domnio, com a Tabela 8 pode-se determinar a
P (eq(vehicle, lane)) utilizando os dados da ABox; por exemplo, se o sensor indicar uma linha
divisria a leste do veculo (e(vehicle, divider)), inferindo as linhas de diviso relacionadas a
cada faixa (e(lane, divider)), ento podemos calcular a probabilidade de cada faixa ser aquela
na qual o veculo est localizado. Intuitivamente, caso o veculo e a faixa estejam ambos leste
da linha divisria percebida pelo sensor, logo o veculo est na faixa.
Tabela 9: Tabela que apresenta quantidade de vezes que uma faixa pode ocorrer dada a combinao das
caractersticas que podem ser percebidas pelos sensores.
OnOneWayRoad OnTwoWayRoad
SolidDivider DashedDivider SolidDivider DashedDivider
L1 1 0 0 0
L2 0 1 1 0
GoingDown
L3 0 1 1 1
L1 1 0 2 0
L2 0 1 0 1
GoingUp
L3 0 1 0 0
Fonte: autor.
Tabela 10: Resposta da primeira questo: "qual faixa tem maior probabilidade do carro estar localizado?"As
evidncias (A) esto expressas nas seis primeiras colunas referentes aos dados dos trs sensores.
formada por cinco redes conectadas. Alm das informaes da ABox, existem as evidncias
do conceito de disjuno (ns Xor) e dos ns que indicam se a rede representa uma faixa, um
veculo ou uma linha divisria.
Com as redes da Figura 32 possvel responder as duas questes:
1. argmaxli P ((v : li : eq)) i = 1, 2, 3 , ou seja, em qual faixa (li) o veculo (v) tem a maior
probabilidade de estar localizado?
2. i : P (li : Down) , ou seja, qual a probabilidade para cada faixa li permitir a direo
Down (descendo)?
Consultando a rede da Figura 32, para os oito estados dos trs sensores obtivemos as respostas
para as questes 1 e 2 apresentadas pelas Tabelas 10 e 11 respectivamente.
A Tabela 10 mostra qual a faixa mais provvel em que o veculo v est dirigindo
(argmaxli P ((v, li : eq))), considerando as evidncias A dos trs sensores representas nas trs
primeiras colunas os dados representando. A primeira linha da Tabela 10, por exemplo, representa
o estado onde o GPS indica GoingDown, o mapa digital indica ser uma rua de mo nica e
o sistema de viso indica uma linha contnua. Dadas estas evidncias o n li com a maior
3.4. Discusso dos Resultados 95
Tabela 11: Resposta da pergunta dois a partir da rede Bayesiana da Figura 32: a probabilidade para a direo de a
faixa ser Down dado s evidncias A (expressas nas seis primeiras colunas).
probabilidade a partir da rede Bayesiana relacional da Figura 32 o n l1. Este caso est
representado na Figura 31a. Na segunda linha da Tabela 10, o GPS e o mapa digital continuam
como descrito anteriormente, contudo a viso percebe uma linha tracejada. Neste caso, tem duas
hipteses com igual probabilidade 2 : l2 e l3, representados nas Figuras 31b e 31c respectivamente.
Todos os outros casos na Tabela 10 so anlogos.
A Tabela 11 representa a resposta para a questo 2 mostrando os valores de probabilidades
para cada faixa li (Downli, Upli), dadas as evidncias das trs primeiras colunas. Pegando a
primeira linha como exemplo, a probabilidade de ser Downli maior para as faixas l1, l2 e l3, o
que consistente com as evidncias percebidas pelos sensores de que o veculo est descendo
uma rua (GoingDown) de mo nica (SensedOnOneWayRoad). Todos os outros casos nesta
tabela so semelhantes. Nosso objetivo foi utilizar os clculos de direes cardinais como
informaes para novas inferncias em domnios reais. Portanto, esta abordagem serviu para
verificar que possvel trabalhar com transitividade das relaes entre indivduos.
foi o primeiro trabalho a utilizar clculos de raciocnio espacial qualitativo estendido com uma
abordagem probabilstica.
Uma discusso sempre levantada que o algoritmo atual tem a restrio da definio
acclica. Essa foi uma das primeiras dificuldades encontradas na formalizao da T Box. Cada
conceito e papel deveriam ser definidos sem gerar ciclos e em uma sequncia tal, que um conceito
que esteja direita tenha sido definido anteriormente. Esse desafio foi superado renomeando
alguns conceitos.
Em CRALC frmulas de incluso para papis tm uma dificuldade adicional, uma vez
que eles podem levar s definies circulares. Hierarquias de papis tambm no fazem parte da
ALC bsico, mas foram necessrios para representar a relao entre as pistas e as suas direes e
entre o veculo e sua faixa de rodagem. Na formalizao apresentada neste trabalho, evitamos os
papis na formalizao do domnio deixando-os implcitos, representando os papis assumidos
pelos indivduos como conceitos, o que permitiu uma representao da relao espacial no
domnio utilizando o algoritmo CRALC. Numa segunda abordagem inclumos as regras de
composio proposionalizando os papis. Isto devido natureza do clculo de direo cardinal,
em que um conjunto de relaes espaciais somente uma relao acontece com o mesmo par
de indivduos. A mesma caracterstica do formalismo raciocnio espacial subjacente deve ser
explorada em outros domnios.
Alm de fornecer uma soluo para o uso de incluses de papis baseada em composio
e hierarquias de funes dentro do CRALC, este trabalho contribui com a formalizao de
preciso do sensor como frmulas T Box probabilsticos em CRALC. Nesta formalizao,
uma preciso estimada em particular foi determinada pelo modelo do sensor a partir do qual
se originou. A maior dificuldade desta tarefa, que ainda enfrentamos no nosso trabalho, a
representao de relaes transitivas, as quais so peas importantes do conhecimento espacial.
Uma considerao a fazer: formalizamos o domnio, porm no tivemos acesso a dados
reais dos sensores para estend-lo a uma aplicao real. O CRALC ainda estava em desen-
volvimento, e sem a hierarquia de papis um sistema com raciocnio espacial para aplicar em
rob mvel no seria uma tarefa a ser realizada em mdio prazo. Mas a partir do conhecimento
adquirido com as formalizaes dos domnios com CRALC codificando um raciocnio espacial,
decidimos aplicar as inferncias com redes Bayesianas a outro domnio com o qual tnhamos
mais contato e que precisava do reforo probabilstico para lidar com as incertezas dos sensores
e do ambiente real. No prximo captulo vamos mostrar este sistema de auto localizao de
um rob mvel que foi estendido combinando um filtro Bayesiano que tem como evidncias as
relaes qualitativas entre elementos do ambiente.
Parte II
Segunda Contribuio
99
Neste captulo vamos propor e explorar um mtodo que combina teorias espaciais
qualitativas com filtro Bayesiano, para executar a tarefa de auto localizao qualitativa de um
rob mvel. O mtodo aqui apresentado foi aplicado em dois domnios com diferentes mapas
qualitativos. Em ambos os domnios as informaes foram extradas das imagens capturadas
pelo rob. O mtodo aqui proposto segue os seguintes passos:
executado pelo rob. A partir dessas informaes uma previso sobre o rob continuar na mesma
regio ou de mudar de regio era inferida, quando o PQRS retornava uma regio diferente daquela
prevista, o sistema fazia uma varredura procurando por um parmetro que confirmasse a crena
na localizao, assim executando a auto calibrao. Baseado nos trabalho apresentado na seo
3.3.2, em uma primeira tentativa para obter um mecanismo de previso probabilstico, esboou-
se uma rede Bayesiana criada a partir da formalizao em PQRS do domnio apresentado em
Fenelon et al. (2012). Percebeu-se, no entanto que o que estvamos propondo era semelhante a
um filtro Bayesiano. Nesta pesquisa o PQRS combinado com filtro Bayesiano foi a abordagem
que melhor se encaixou a aplicao no rob mvel.
Assim, o que fizemos foi estender a teoria PQRS, combinando-a com um filtro Bayesiano.
O filtro Bayesiano utilizado para estimar a localizao do rob e tambm para melhorar a
segmentao, determinando o limiar dado o estado atual do rob. Contudo neste trabalho s
foi possvel aplicar o PQRS em ambiente com um nico objeto. Em ambiente com mltiplos
objetos, aplicamos o raciocnio espacial que utilizou a informao de ocluso entre pares de
objetos no lugar das relaes de ocluso entre objeto e sua sombra. O filtro Bayesiano com as
informaes espaciais qualitativas foi utilizado principalmente para estimar a auto localizao
relativa s regies definidas nos mapas qualitativos.
Figura 34: Representao espacial (a) das regies considerando um ambiente real, e (b) representao do mapa
qualitativo com a cinco regies distintas, mostrando os lados direito e esquerdo e as regies(Region1 at Region5 ).
As linhas de viso entre a fonte de luz L, o objeto O e sua sombra definem as fronteiras entre as regies. Neste
diagrama somente o topo da sombra utilizado na definio das regies.
(a) (b)
Fonte: (a) Santos, Dee e Fenelon (2008) (b) Fenelon et al. (2012).
Figura 35: Uma representao da posio dos objetos no contexto deste experimento.
Fonte: autor.
102Captulo 4. RACIOCNIO ESPACIAL QUALITATIVO PROBABILSTICO PARA LOCALIZAO ROBTICA
A imagem tem um sistema de coordenadas com a origem dos eixos na lateral direita
superior (relativo imagem).
Figura 36: Uma representao grfica para a definio das direes Left, Right, Front e Behind (esquerda, direita,
em frente, atrs) relativos viso do rob atravs da imagem. Os eixos de coordenadas da imagem tem origem no
canto acima-direito relativo imagem.
Fonte: autor.
Figura 37: Diagrama representando nove regies formadas pelas linhas de viso.
Fonte: autor.
ambos em relao origem do eixo x. O objeto mais prximo est posicionado esquerda do
objeto mais distante da origem de x, enquanto este est direita do objeto mais prximo da
origem de x. Para identificar qual o objeto est frente ou atrs comparamos a distncia da base
relativa origem do eixo y de ambos os objetos. O objeto mais distante est frente do objeto
mais prximo origem do eixo y, enquanto que este est atrs do objeto mais distante da origem
do eixo y. Pela Figura 36 do ponto de vista do observador podemos dizer que a est esquerda e
em frente de b, enquanto que b est direita e atrs de a.
Nove regies so definidas a partir das linhas de viso entre dois objetos conforme
diagrama da Figura 37. As linhas de viso so tangentes internas e externas relativas aos dois
objetos (A, B). Do ponto de vista de um observador que esteja sobre as linhas de viso tan-
104Captulo 4. RACIOCNIO ESPACIAL QUALITATIVO PROBABILSTICO PARA LOCALIZAO ROBTICA
Figura 38: As duas figuras representam as regies e as relaes espaciais percebidas em cada uma (a)As relaes
de ocluso e (b) as relaes de direo para cada regio, todas as relaes percebidas por um observador . Somente
a regio Region9 no possvel visualizar o par em nenhuma posio do observador.
(a) (b)
Fonte: autor.
A frmula (4.7) significa que: quando na Region1 do ponto de vista - A oclui parcialmente B
e A est esquerda e a frente de B (Figura 39a).
A frmula (4.8) significa que: quando na Region2 do ponto de vista - A oclui totalmente B e
A est na frente de B. Ou seja, somente A visto e est mais prximo do observador (Figura
39b).
A frmula (4.9) significa que: quando na Region3 do ponto de vista - A oclui parcialmente B
e A est direita e na frente de B (Figura 39c).
A frmula (4.10) significa que: quando na Region4 do ponto de vista - A e B esto livres de
ocluso e A est direita de B (Figura 39d).
A frmula (4.11) significa que: quando na Region5 do ponto de vista - B oclui parcialmente
A e A est direita e atrs de B (Figura 39e).
A frmula (4.12) significa que: quando na Region6 do ponto de vista - B oclui totalmente A e
A est atrs de B (Figura 39f).
A frmula (4.13) significa que: quando na Region7 do ponto de vista - B oclui parcialmente
A e A est esquerda e atrs de B (Figura 39g).
A frmula (4.14) significa que: quando na Region8 do ponto de vista - A e B esto livres de
ocluso e A est esquerda de B (Figura 39h).
A frmula (4.15) significa que: quando na Region9 do ponto de vista - A e B esto livres de
ocluso. Contudo, nesta regio somente um observador com campo de viso de 360 poderia
observar A e B na mesma imagem (Figuras 39i e 39j respectivamente).
Mapas qualitativos podem ser formados a partir da disposio espacial de pares de objetos
no ambiente. Para analisar o comportamento do algoritmo de raciocnio espacial qualitativo
probabilstico colocamos em nosso ambiente mais um objeto formando trs pares em cena
(Figuras 40a e 40b). No mapa qualitativo o nmero de regies depende da disposio relativa dos
objetos. Por exemplo, com os trs objetos alinhados 14 regies so formadas (Figura 40a), esta
configurao no ser utilizadas neste trabalho. Com os objetos dispostos de forma triangular
formando as 28 regies representadas no mapa qualitativo da Figura 40b, as quais so resultados
da sobreposio das nove regies de cada um dos trs pares de objetos.
106Captulo 4. RACIOCNIO ESPACIAL QUALITATIVO PROBABILSTICO PARA LOCALIZAO ROBTICA
Figura 39: Exemplo de uma visualizao para (a) Region1 , (b) Region2 , (c) Region3 , (d) Region4 , (e) Region5 ,
(f) Region6 , (g) Region7 , (h) Region8 , (i e j) Region9 onde os objetos esto livres de ocluso, mas o campo de
viso no permite visualizar os dois em uma mesma cena.
(a) (b)
(c) (d)
(e) (f)
(g) (h)
(i) (j)
Fonte: autor.
4.3. Definindo a Localizao do Rob 107
Figura 40: Representaes dos mapas qualitativos formados pelas linha de viso com duas configuraes de
posio que os trs objetos podem assumir neste contexto.
(a) (b)
Fonte: autor.
Do ponto de vista do observador, nesta regio, o topo da sombra nunca ocluso pelo objeto que
a projetou. Uma representao do topo da sombra pode ser vista na Figura 41c onde somente
a regio que representa o topo da sombra est destacada em vermelho. Nas outras imagens
toda a regio equivalente sombra do objeto est destacada em vermelho para uma melhor
108Captulo 4. RACIOCNIO ESPACIAL QUALITATIVO PROBABILSTICO PARA LOCALIZAO ROBTICA
Figura 41: Imagens capturadas com o rob posicionado em distintos pontos na regio 1. A imagem (c) mostra
somente o topo da sombra em destaque. Note que o objeto no oclui a sombra.
(a) (b)
.
(c)
Nesta regio o objeto comea a ocluir a sombra, ainda assim, a maior parte da sombra pode ser
percebida do ponto de vista de um observador. A imagem (Figura 42) aponta para as duas laterais
4.3. Definindo a Localizao do Rob 109
Figura 42: Imagens capturadas com o rob na regio 2. Note que o objeto comea a ocluir a sombra. Todavia
ainda se v a sombra do topo do objetivo e as laterais da sombra do objeto indicados em (a).
(a) (b)
Fonte: autor.
Figura 43: Imagens capturadas com o rob na regio 3. A sombra nesta regio aparece com um dos lados
totalmente ocluso pelo objeto. Existe uma conexo entre a parte superior do objeto e sua sombra projetada.
(a) (b)
Fonte: autor.
da sombra, as quais podem ser observadas na sombra projetada enquanto o observador estiver na
regio 2, entretanto uma delas aparece parcialmente. Na Figura 42 as fronteiras foram marcadas
com barbante, e a fronteira com a regio 1 aquela na qual a ocluso da lateral da sombra se
inicia. Outras caractersticas tpicas desta regio so: o tamanho da sua rea est entre 50% e 90%
do tamanho da rea do objeto por causa da ocluso; em relao ao eixo y da imagem as bases
dos retngulos que contm e definem o objeto e sombra na imagem esto aproximadamente no
mesmo nvel; a regio do topo da sombra fica totalmente desconectada do objeto. Esta regio faz
fronteira com regio 1 e tambm vizinha da regio 3.
110Captulo 4. RACIOCNIO ESPACIAL QUALITATIVO PROBABILSTICO PARA LOCALIZAO ROBTICA
Figura 44: Imagens capturadas com o rob na regio 4. A sombra nesta regio quase desaparece oclusa pelo
objeto. Contudo ainda existe uma conexo entre a parte superior do objeto e a sombra.
(a) (b)
Fonte: autor.
Do ponto de vista do observador, o topo da sombra est ocluso parcialmente pelo objeto. Nas
imagens somente uma das laterais da sombra pode ser observada (Figura 43). Outros exemplos
de caractersticas tpicas desta regio so: a rea da sombra menor que 50% da rea do objeto;
devido ocluso parcial, o topo da sombra est conectado a lateral do objeto. A regio 3 fica
localizada entre as regies 2 e 4.
Do ponto de vista do observador, somente uma pequena parte da sombra do objeto percebida.
Quase todo o topo da sombra est ocluso pelo objeto. Na imagem (Figura 44) a relao entre
as reas da sombra e do objeto difere da relao na regio 3 principalmente pelo tamanho da
rea da sombra. A sombra bem menor que o objeto, aparecendo na imagem como uma regio
estreita de sombra na lateral do objeto. Esta regio vizinha das regies 3 e 5.
4.3. Definindo a Localizao do Rob 111
Figura 45: Imagem capturada com o rob na regio 5. A sombra do objeto no aparece na imagem por estar
totalmente oclusa. O observador est na regio equivalente ao ponto de vista da luz.
Fonte: autor.
Do ponto de vista do observador, a sombra do objeto existe, mas no pode ser percebida, pois
est totalmente oclusa pelo objeto. A caracterstica principal desta regio que somente o objeto
pode ser observado (Figura 45) na cena. Com essa regio a formalizao para a localizao no
mapa da Figura 34b est completa.
Figura 46: Mapa qualitativo da disposio espacial dos objetos e a representao das regies.
Fonte: autor.
located(R9, , b, g, r) N onOccludesDC(b, g, )
N onOccludesDC(b, r, ) Lef t(b, r, ) (4.29)
N onOccludesDC(g, r, ) Right(g, r, );
Esta frmula (4.50) representa a atualizao de medidas. O primeiro termo P (et , T h|st ) o
modelo da imagem (form.(4.50)) e incorpora a nova evidncia et . O segundo termo a previso
116Captulo 4. RACIOCNIO ESPACIAL QUALITATIVO PROBABILSTICO PARA LOCALIZAO ROBTICA
para o estado atual, ou seja, a crena posterior P (st |e0:t1 ) = bel(st ), esta deve ser calculada
antes de incorporar a evidncia et .
A crena posterior P (st |e0:t1 ) representa o passo de previso do estado st , obtido
previamente pelo condicionamento no estado anterior st1 , consequentemente,
st1
E finalmente, substituindo frmula (4.54) na frmula (4.50) temos a crena no estado atual dada
por (form. 4.54):
st1 Th
Na seo seguinte est descrito o filtro Bayesiano para a auto localizao com mltiplos objetos.
Figura 47: Mapa qualitativo das reas de atuao divididas em oito regies.
Fonte: autor.
Figura 48: Diagrama conceitual de vizinhana (CND) das relaes que determinam a regio na qual o rob estava
localizado. As transies esto representadas pelas setas e a mudana ocorre sempre para uma relao (regio)
vizinha.
nessa regio, isto representado como uma constante (numeral) na Tabela 12. A outra parte
depende do movimento realizado pelo rob.
O deslocamento do rob pela rea de atuao segue o conceito espacial de transio
contnua, do mesmo modo que o conceito de transio de relaes do diagrama conceitual de
vizinhana (CND) discutido na seo 2.2. A Figura 48 representa um CND das transies das
relaes que so percebidas em cada uma das regies do mapa da Figura 47. Em cada regio
ocorre uma relao diferente entre sombra e objeto (Figura 48). Podemos afirmar que cada
relao tem um conjunto de caractersticas que a distingue. Algumas dessas caractersticas
podem ser compartilhadas, principalmente durante uma transio entre as relaes vizinhas. Ao
analisar as imagens com sombra e objetos as relaes entre ambos mudam conforme o rob
se desloca. Por esse motivo, utilizamos um fator w que o valor proporcional ao conjunto de
caractersticas observadas para cada relao vinculada a uma regio. Na Tabela 12 este fator
modula a probabilidade da mudana de estado. Por exemplo, considerando duas regies vizinhas,
quando o rob se desloca em direo a uma das regies vizinhas as caractersticas desta regio
aumentam enquanto que as caractersticas daquela que o rob se afasta diminuem.
O modelo de transio para mltiplos objetos foi criado de modo anlogo ao modelo
de transio para o mapa da Figura 47 (sombra-objeto). Para o mapa (Figura 46) o modelo de
transio uma matriz 28 x 28 com os valores de probabilidade da transio de uma regio
para outra do mapa. Cada valor deste modelo compe-se de um nmero real fixo associado a
uma funo. O valor real fixo baseado na configurao do mapa (Figura 46) considerando
a vizinhana e o tamanho da regio. Intuitivamente em regies maiores a probabilidade de
continuar nelas maior. A funo est relacionada a percepo de movimento atravs da imagem,
quando o rob se aproxima de uma fronteira, algumas caractersticas que definem as relaes
espaciais podem ser observadas, o que permite distinguir entre as regies vizinhas, aquela que o
rob est se direcionando, reforando o valor de probabilidade do modelo de transio. Na Figura
49 uma ilustrao topolgica das 28 regies como ns, e as transies entre regies vizinhas
representadas pela seta continua, a seta tracejada so para regies que no tm fronteiras, mas
esto prximas.
A prxima etapa refere-se a determinar os algoritmos baseados nas formalizaes de
localizao que fazem parte do sistema responsvel pela inferncia de localizao do rob.
4.4. Filtro Bayesiano 119
Tabela 12: O modelo de movimento considerando que o rob tem uma navegao no sentido horrio. Este modelo
baseado no tamanho qualitativo e na transio das regies. O valores so alterados por uma funo de mudana
percebida w que representa a paralaxe causada pelo movimento do rob
Figura 49: Representao das regies como ns, e das transies entre regies prximas como setas: setas
contnuas regies com fronteira, tracejadas regies sem fronteira entre elas.
Fonte: autor.
120Captulo 4. RACIOCNIO ESPACIAL QUALITATIVO PROBABILSTICO PARA LOCALIZAO ROBTICA
Figura 50: Janelas para calibrao manual dos parmetros de viso utilizados no filtro de limiar para segmentar
objeto e sombra, os valores escolhidos pela barra de rolagem ficam indicados esquerda da barra. Da esquerda para
direita da figura: define o limiar T h que separa objeto e sombra do ambiente; define o limiar que separa objeto da
sombra; define o limiar que separa a sombra do objeto.
Fonte: autor.
Tabela 13: Tabela com os valores que diferenciam as caractersticas em cada relao.
Caracterisitica DC EC PO TPPI
1 maior que -1 entre(-25 , 23) entre(-37,-4) menor que -14
2 maior que -72 entre(-136,-48) menor que -66 entre(-100,-78)
3 entre(113,201) maior que 72 entre(33,157) menor que 37
4 maior que 83 entre(68,163) entre(76,205) menor que 104
5 maior que 0,64 maior que 0,71 entre(0,33,0,79) menor que 0,41
6 maior que 9600 entre(4525,17403) entre(1903,8011) menor que 2376
7 entre(11,82) maior que 11 entre(4,54) entre(2,38)
8 menor que 87 entre(4,88) maior que 1 menor que 71
9 zero menor que 16 menor que 25 menor que 40
10 maior que 11 entre(32,126) entre(6,132) entre menor 118
Fonte: autor.
Na Tabela 13 esto os valores que cada uma das caractersticas listadas acima pode
assumir dependendo da relao espacial entre o objeto e sombra. A primeira coluna representa as
caractersticas, enquanto que as colunas seguintes representam cada relao espacial observvel
entre sombra e objeto. Cada linha representa uma caracterstica e os valores que ela pode assumir
na ocorrncia de cada relao espacial (DC, EC, P O, T P P I). Por exemplo, na primeira linha
a caracterstica 1 referente a distncia relativa em y entre as bases dos retngulos limitadores
da sombra e do objeto. Em DC (maior que -1) de modo qualitativo significa que a base do
retngulo limitador da sombra est na mesma altura ou abaixo da base do retngulo do objeto.
De modo anlogo para EC a base do retngulo limitador da sombra pode estar um pouco abaixo
4.5. Algoritmos Utilizados no Sistema de Auto Localizao 123
ou um pouco acima, enquanto que estar sempre acima da base do retngulo do objeto para as
relaes espaciais P O e T P P I. Notem que alguns valores podem ser comuns para mais de uma
relao espacial. As caractersticas de 1 a 6 referem-se posio relativa entre os retngulos que
envolvem a sombra e o objeto. As caractersticas de 7 a 10 so relativos ao nmero de pontos
conectados entre o objeto e a sombra.
A evidncia pode ser uma das relaes DC, EC, P O, T P P I ou N T P P I. Caso o
objeto no tenha sombra na imagem, ento somente a relao N T P P I analisada. Assim, no
algoritmo 1 dada a evidncia (linha 4 ), a linha 5 calcula a crena para todas as cinco regies
representadas por St , no intervalo de limiar ([T h 5, T h + 5]). Com a crena das regies e os
dois modelos, as prximas linhas do algoritmo 1 calculam a previso e o limiar T h para serem
utilizados em t + 1. A linha 6 d o resultado sobre a regio atual (st ) e o limiar (T h) que ser
utilizado no prximo frame. O filtro Bayesiano manipula dois modelos de probabilidades, o
modelo de imagem e o modelo de transio. As duas linhas finais no algoritmo 1 so referente a
previso, a crena atual para todos estados (dada a evidncia) calculada na linha 7. O modelo de
transio que diz respeito transio entre as regies est representado na linha 8 (P (St+1 |st )).
Com os valores do modelo de transio (Tabela 12) e aqueles calculados na linha 7, na linha 8
calculado a previso da distribuio de crena de cada estado para o prximo frame.
de crena (linha 5). A ltima etapa calcular a previso para t + 1 (bel(st+1 )), marginalizando
em st o produto da crena P (st |et ) com o modelo de transio P (st+1 |st ).
Esse o sistema de modo geral, que depende de um sistema de viso, capaz de reconhecer
os elementos e as caractersticas que determinam as relaes entre eles. A seguir vamos descrever
esses algoritmos comeando pelos algoritmos de reconhecimento dos elementos alvos.
Figura 51: Exemplo de sequncia da segmentao de um quadro na deteco ROI:(a) canal V, (b) canal V aps
limiar acima , (c) filtro morfolgico, (d) retngulo verde indica regies candidatas a regio de interesse (ROI), (e)
canal S aps filtro passa-alta sat , (f) mscara ROI.
(a) (b)
(c) (d)
(e) (f)
Fonte: autor.
4.5. Algoritmos Utilizados no Sistema de Auto Localizao 127
Figura 52: Exemplo de sequncia da segmentao de um quadro na deteco de objetos: (a) Imagem objeto e
sombra depois de aplicado a mscara, (b) filtro de limiar abaixo e filtro morfolgico, (c) imagem binria da base do
objeto, (d) retngulo azul indica objetos encontrados na segmentao, (e) ltima mscara ROI criada pelo sistema
de viso.
(a) (b)
(c) (d)
(e)
Fonte: autor.
4.5. Algoritmos Utilizados no Sistema de Auto Localizao 129
Figura 53: Exemplo de sequncia da segmentao de um quadro na deteco de sombras: (a) Imagem com objeto
depois de aplicada a segunda mscara, (b) Imagem aps filtros de limiar acima e morfolgico de abertura, (c)
retngulo limitador vermelho indicando a sombra localizada.
(a) (b)
(c)
Fonte: autor.
dentro so apagadas da mscara. Somente os retngulos com objetos so mantidos criando uma
nova mscara (Figura 52e).
Aplicando a nova mscara na imagem com sombra e objeto obtm-se uma imagem
que mantm as regies que possuem objeto alvo (Figura 53a). Este procedimento equivale a
uma subtrao de fundo deixando as regies com os elementos alvos. Quando comparamos a
Figura 52a (que mostra a imagem obtida com a primeira mscara) com a Figura 53a, nota-se que
toda a regio de penumbra no existe mais, permanecendo somente as regies compreendidas
pelo retngulo limitador da regio ROI com os objetos alvos.
Para segmentar a sombra, aplicado o filtro de limiar acima com o limiar s determinado
na calibrao inicial. Os valores de intensidade maiores que s permanecem e todos os outros
vo para zero conforme frmula (4.59).
Imagem sombra(x, y) =
(4.59)
0 em outro caso.
130Captulo 4. RACIOCNIO ESPACIAL QUALITATIVO PROBABILSTICO PARA LOCALIZAO ROBTICA
Figura 54: Exemplo de segmentao do objeto e sua sombra. O topo da sombra tambm detectado pelo sistema
de viso conforme destacado nesta imagem.
Como resultado da frmula (4.59) obtm-se uma imagem onde somente a regio equi-
valente a sombra permanece. Nesta imagem com sombras aplicado um filtro morfolgico de
abertura para eliminar rudos (Figura 53b), e achando os componentes conectados para que seja
determinada a regio equivalente a sombra e suas informaes. Caso uma regio de sombra se
encontre totalmente dentro do retngulo que limita o objeto, esta no ser considerada como
sombra, pois em geral um reflexo da luz no objeto. Para os demais casos, guardam-se as
caractersticas das regies de sombra, tal como rea, os dados do menor retngulo que contm a
rea da sombra, se a sombra est encostada nas bordas da imagem e a quantidade de sombras
existentes na imagem, a regio equivalente ao topo da sombra. Uma sombra tem valores de
intensidade diferentes, e a intensidade dos pixels do topo da sombra so mais altos. Assim, com
um filtro de limiar possvel localizar o topo da sombra.
Como exemplo a Figura 53c mostra a sombra encontrada limitada pelo retngulo ver-
melho, enquanto que a Figura 54 mostra a localizao do objeto e da sombra limitados pelos
retngulos azul e vermelho respectivamente. A regio equivalente ao topo da sombra est desta-
cada em branco (Figura 54). Esse foi o algoritmo responsvel pela deteco de sombra e objeto,
a seguir o algoritmo para deteco de objetos.
definindo regies onde as caixas possam estar presentes (Figura 55e). Em todos os casos para
definir as regies (ROI, objeto, sombra) foi utilizado o Algoritmo 6: logo aps aplicar um filtro
de limiar (Figura55c); utilizamos um filtro morfolgico de abertura que elimina parte do rudo
na imagem; para em seguida localizar as regies conectadas (Figura 55d). A localizao de cada
regio conectada na imagem determinada pelo menor retngulo que a contm (Figura 55f).
Os objetos tm cores diferentes, vermelho, azul e verde, assim trs imagens so criadas
aplicando a mscara no canal de matiz H. Aplicando um filtro de limiar passa faixa no canal
de matiz (H) somente as cores dentro da faixa permanecem na imagem. Aplicando o filtro
morfolgico e componente conectado, so encontradas as regies equivalentes a cada objeto e
suas informaes so armazenadas. Com as informaes de posio, de cor do objeto, verifica-se
a profundidade mdia da rea central da regio do objeto na imagem de profundidade. Com as
informaes tanto de sombra e objeto quanto de objetos a prxima etapa determinar os pares
e a relao entre eles. Vamos comear pelo algoritmo que analisa a correspondncia entre a
sombra e o objeto.
Figura 55: Exemplo de sequncia da segmentao de um quadro na deteco ROI:(a) canal V, (b) canal V aps
limiar acima , (c) filtro morfolgico, (d) retngulo verde indica regies candidatas a regio de interesse (ROI), (e)
canal S aps filtro passa-alta sat , (f) mscara ROI.
(a) (b)
(c) (d)
(e) (f)
Fonte: autor.
se conecta a nenhuma base dos objetos em cena. Esses casos so casos especiais, tais como
sombras provocadas por um objeto que esteja fora da cena ou oculto por outro objeto. Os casos
de ocluso e de objeto com duas sombras no ocorrem nos experimentos relatados neste trabalho,
pois utilizamos somente um nico objeto alvo em cena.
Toda a sombra e objeto que so correspondentes entre eles formam o par objeto-sombra,
e algumas informaes sobre o par tambm so armazenadas, tal como a posio relativa entre
os retngulos que definem a sombra e o objeto. As informaes coletadas sero utilizadas para
definir as relaes entre o objeto e a sobra. Essas relaes so as evidncias utilizadas para auto
localizao do rob, como descrito na seo 4.5.1. A seguir o algoritmo que infere a relao
entre pares de objetos.
134Captulo 4. RACIOCNIO ESPACIAL QUALITATIVO PROBABILSTICO PARA LOCALIZAO ROBTICA
Figura 56: Imagem exemplo de busca de regies externamente conectadas, para cada sombra todas as bases de
objetos so verificadas onde as bordas se encontram intensidade aumenta e EC verdade.
(a)
(b) (c)
(d) (e)
Fonte: autor.
4.5. Algoritmos Utilizados no Sistema de Auto Localizao 135
A partir das informaes dos objetos podemos acrescentar outras e descobrir o tipo de
relao entre pares de objetos. Para cada par verificado quais das relaes de direo (posio
e profundidade) e relaes topolgicas (ocluso) so percebidas. Para determinar se o par tem
uma relao Right ou Lef t compara-se a posio dos objetos relativa ao eixo x da imagem
(Figura 36). Para determinar se o par tem uma relao F ront ou Behind compara-se a distncia
de ambos os objetos em relao ao rob. Utilizamos principalmente as informaes da imagem
de profundidade do sensor Kinect, quando no possvel obter a leitura deste sensor utilizamos
as localizaes dos objetos em cena relativas ao eixo y (Figura 36).
Para determinar a conexo entre os objetos, assim como no problema objeto e sombra
(seo 4.5.5), as bordas so somadas em uma imagem e depois subtradas permanecendo somente
aqueles pixels onde as bordas se sobrepuseram (Figura 57). Todos os pixels que sobram so
contados, caracterizando a conexo entre objetos, a Figura 57h mostra a conexo que ocorre na
Figura 57f. Quando os objetos esto prximos, mas ainda no esto conectados, alguns pontos
de conexo comeam a aparecer. Essa uma caracterstica que pode indicar movimento, outra
caracterstica a distncia entre o par, ou seja, quando dois objetos se aproximam ou se afastam
entre si na sequncia de imagens.
As informaes de conexo, distncia e profundidade so parme-
tros utilizados para determinar se os objetos esto parcialmente sobrepostos
(P artiallyOccludesP O ou P artiallyOccludesP O1 ). Utilizamos uma varivel para indicar a
condio de ocluso (ocluindo) (algoritmo 7), nas cenas em que somente um objeto aparece, caso
o par desse objeto esteja na condio de ocluso, infere-se que o objeto invisvel est totalmente
ocluso por aquele objeto em cena (T otallyOccludesN T P P ou T otallyOccludesN T P P I).
Finalmente, quando entre os objetos no existe conexo e o par est livre de ocluso a relao
percebida a N onOccludesDC. Neste experimento as relaes percebidas so informaes
para definir a localizao. Quanto mais informaes menor ser o nmero de evidncia retornada
para o algoritmo 3 que ser utilizada na etapa de atualizao de informao (linha 3 algoritmo 3)
do algoritmo de auto localizao.
136Captulo 4. RACIOCNIO ESPACIAL QUALITATIVO PROBABILSTICO PARA LOCALIZAO ROBTICA
(c) (d)
(e) (f)
(g) (h)
5 EXPERIMENTOS EM RACIOCNIO
ESPACIAL QUALITATIVO PROBABI-
LSTICO PARA AUTO LOCALIZA-
O DO ROB MVEL
visual. Isso porque importante que a primeira imagem tenha objeto e sombra por completo,
pois essa imagem ser utilizada em uma calibrao manual do limiar para segmentao. Depois
que se inicia o algoritmo de captura e controle do rob, o operador tem autonomia para parar de
salvar os frames capturados, assim como marcar em qual a regio o rob esta localizado durante
a captura da imagem. Deste modo, para evitar erro na anotao, as imagens deixavam de serem
salvas quando o rob passava de uma regio para a outra, o que garantiu uma anotao correta
da regio em que a imagem foi capturada. Para cada imagem salva os dados relacionados a essa
imagens tais como: o nome da imagem, a regio real, a velocidade e posio relativa ao inicio de
cada coleta so armazenados em arquivo.
Esse conjunto de imagens foi utilizado para o experimento de auto localizao e auto
calibrao e por esse motivo foi mantida a sequncia de captura. Por limitaes do rob, a captura
foi realizada em dias e horrios diferentes, recomeando a captura sempre do ponto que finalizou
a sequncia anterior. Deste modo a sequncia de transio espacial foi mantida. O rob capturou
587 imagens passando por todas as regies pelo menos uma vez. Contudo, em aproximadamente
33% das imagens no foi possvel manter por completo o objeto e a sombra dentro do campo de
viso do rob (Figura 59).
Todas as 587 imagens RGB com resoluo de 640 x 480 e os dados em arquivo, foram
utilizados para fazer os experimentos off-line. Alm desse conjunto em sequncia, havia em
arquivos outras imagens de capturas anteriores, as quais estavam separadas por regio onde
foram capturadas, algumas dessas imagens foram utilizadas para criar o modelo de imagem. Na
prxima seo vamos descrever o algoritmo de auto localizao e auto calibrao.
Depois de preparar o ambiente (seo 5.1.2), o rob P eopleBotT M foi remotamente con-
trolado para navegar por todas as 28 regies. A posio inicial aquela escolhida pelo operador
que controla o rob navegando pelo ambiente entres as caixas salvando imagens RGB e imagens
binrias de profundidade e os dados de hodometria. Para este experimento somente as imagens
RGB e de profundidade capturadas com o sensor Kinect foram utilizadas. Esse procedimento
semelhante ao procedimento realizado no ambiente com sombra 5.1.1, porm no foi possvel
anotar as regies onde o rob estava passando durante o experimento. Tambm no necessria a
calibrao dos parmetros de viso. Em duas coletas foram capturadas aproximadamente 18000
frames formando dois conjuntos de sequncias de imagens com resoluo de 640 x 480.
Em cada coleta foram executadas aproximadamente trs voltas pelo ambiente alterando o
circuito, porm procurando manter os objetos no campo visual do rob. O primeiro conjunto com
9033 imagens foi utilizado para criar o modelo de imagem (seo 5.1.6), enquanto que o segundo
com 9483 imagens foi utilizado no experimento off-line de auto localizao. Considerando o
nmero de objetos que aparecem em cena, os dois conjuntos de imagens juntos tm 9% de
Captulo 5. EXPERIMENTOS EM RACIOCNIO ESPACIAL QUALITATIVO PROBABILSTICO PARA AUTO
142 LOCALIZAO DO ROB MVEL
Figura 59: Imagens em que o objeto e a sombra no esto completamente dentro do campo de viso do rob. O
sistema somente com raciocnio espacial no poderia inferir uma localizao a partir dessas imagens.
(a) (b)
(c) (d)
Fonte: autor.
Figura 60: Ambiente utilizado para captura e auto-localizao com mltiplos objetos.
Fonte: autor.
5.1. Descrio dos Ambientes de Testes 143
Figura 61: Imagens capturadas com trs pares, um par e nenhum par em cena
(a) (b) (c) (d)
Fonte: autor. .
imagens com trs objetos, 42% com dois objetos, e com um ou nenhum objetos 45% e 5%
respectivamente.
Neste procedimento no foram salvas as informaes de localizao real enquanto o
rob capturava a imagem. Por isso a tabela (gold standard) que ser utilizada para comparar a
resposta do sistema foi elaborada manualmente. Cada imagem foi analisada pelo especialista
que anotou os dados da regio onde o rob estava localizado, quais objetos visveis em cena,
alm das relaes espaciais entre os pares. Para isso contou com a ajuda das informaes do
ambiente em cena e do barbante, o qual foi o principal parmetro utilizado para reconhecer em
qual regio o rob estava localizado no momento da captura do frame. Distinguir uma regio
de outra foi possvel utilizando a ocluso do barbante pela caixa. O conjunto que foi utilizado
no experimento de auto localizao composto por 12% de imagens com trs pares, 46% de
imagens com um par, e 42% de imagens sem pares, destas imagens ou h somente uma caixa
(39%) ou nenhuma (3%) presente em cena. A Figura 61 tem um exemplo para cada caso. Com
as imagens coletadas e antes de colocar o sistema para inferir localizao, fizemos o modelo de
imagens para cada um dos domnios.
Escolhemos somente imagens nas quais tanto o objeto quanto a sombra estavam completa-
mente em cena. Este conjunto garante que existe sempre objeto-sombra para ser avaliado
pelo sistema de viso.
Todas as imagens separadas por regio foram analisadas pelo algoritmo 2, para cada valor
de limiar. Este algoritmo o responsvel por determinar qual o tipo de relao espacial
qualitativa percebida entre o objeto e a sombra.
1
Open Source Computer Vision - http://opencv.org/-ltimoacesso06/02/2014
5.2. Mtodo de Avaliao 145
Fonte: autor.
resultados corretos
acia =
acur (5.1)
todos resultados
Region1 97% 3% 0% 0%
Region2 25% 74% 1% 0%
Region3 9% 21% 66% 4%
Region4 6% 0% 8% 86%
Region5 0% 0% 35% 65%
as linhas representam a regio na qual o rob estava (de acordo com a tabela de referncia gold
standard).
A Tabela 14 tem os valores de resposta do sistema PQRS probabilstico em porcentagem
para cada regio onde as imagens foram capturadas. Na regio Region1 o sistema apresentou uma
acurcia de 97% e os 3% restantes o sistema deu como resposta a regio vizinha Region2 . Em
Region2 o sistema obteve uma acurcia de 74%, os 26% restantes o sistema deu como resposta
uma das regies vizinhas Region1 e Region3 em um total de 25% e 1% respectivamente. J para
a regio Region3 a acurcia foi de 66%, sendo que achou estar localizado nas vizinhas Region2
e Region4 em 21% e 4% das imagens respectivamente, em 9% das imagens deu como resposta
a Region1 . Para a Region4 a acurcia do sistema foi de 86%, com sistema se localizando na
vizinha Region3 em 8% e na regio Region1 em 6%. A acurcia do sistema na regio Region5
no existe j que esta regio no foi avaliada por este sistema (que utiliza a relao objeto-sombra
visveis na imagem), como localizao apresentou 65% na vizinha Region4 e 35% na regio
Region3 .
A Tabela 15 compara os resultados obtidos utilizando o PQRS com uma base de conhe-
cimento com aqueles obtidos com o aqui proposto PQRS probabilstico. O sistema PQRS com
uma base de conhecimento tem a informao da regio na qual o rob est localizado e procura
um limiar que confirme essa informao para esta localizao, ou para as vizinhas (FENELON
et al., 2012).
Na Tabela 15, a linha refere-se localizao real de cada imagem (regies Region1
at Region5 ). A coluna #imagens representa a quantidade de imagens capturadas por regio.
Enquanto que a coluna "#inf completa" apresenta a porcentagem de imagens na qual a sombra e
o objeto esto completamente dentro da imagem. Para compor os valores dessa coluna ficaram
de fora: imagens sem sombra ou objetos; imagens s com sombras, imagens nas quais a sombra
ou o objeto esto encostados em uma das laterais da imagem. Os resultados de acurcia obtidos
com PQRS esto representados na coluna "baseado no conhecimento. Os resultados da coluna
"baseado na crena so referentes aos resultados de acurcia obtidos com PQRS probabilstico.
5.3. Resultados para Auto Calibrao e Auto Localizao com Sombras 147
Tabela 15: Valores de acurcia do algoritmo baseado em conhecimento e o com o filtro Bayesiana qualitativo,
onde # imagens o nmero de imagens capturadas em cada regio.
baseado no baseado
Regies # imagens #inf completa (%) conhecimento (%) na crena (%)
Region1 225 54 66 97
Region2 171 65 34 74
Region3 138 77 80 66
Region4 36 92 44 86
Region5 17 94 59 0
Global 587 67 58 80
Como exemplo, a ltima linha mostra que para 587 onde 67% tinham informao completa na
imagem o desempenho foi de 58% com PQRS para 80% de acurcia com o PQRS probabilstico.
O sistema PQRS consegue lidar com algum grau de incerteza, na Tabela 15 podemos ver
o reflexo disso nas linhas referentes s regies Region1 e Region3 onde o sistema obteve uma
porcentagem de acerto maior que o nmero de imagens com informao completa. Ainda assim,
com exceo da regio Region3 o sistema PQRS probabilstico apresentou desempenho superior
e em presena de incerteza em todas as regies. A Tabela 14 mostra que o maior nmero de
falsos negativos para a Region3 foi relatado com o rob localizado na regio 2 (21% dos casos),
parte deste erro devido ao problema de fronteira.
Na fronteira entre duas regies o nmero de caractersticas que indica a relao entre
objeto-sombra igual para ambos os locais. O problema de fronteira ocorre porque ao escolher
qual a relao espacial (evidncia) com mxima probabilidade somente aquela na qual o valor
foi analisado primeiro passa como evidncia para o filtro Bayesiano. Esta escolha teve reflexos
positivos nas regies Region1 , Region2 e Region4 , entretanto na Regio Region3 a acurcia
decaiu em comparao com experimentos anteriores.
A regio Region5 um caso a parte j que para estes experimentos optamos por codificar
o sistema sem mecanismo para inferir esta regio. Isso devido ao modelo de movimento, no qual
a relao de ocluso total (Totally Occludes) no foi considerada na composio da funo w, j
que esta funo calculada com a existncia de sombras. Como a rea dessa regio pequena, o
efeito negativo sobre o desempenho global foi de aproximadamente 2, 8%.
O desempenho global deste experimento apresentou uma elevao da acurcia passando
de 58% no PQRS para 80% no PQRS probabilstico. Os resultados com o sistema PQRS
probabilsticos foram animadores, contudo os testes de auto localizao foram realizados somente
com um objeto (mapa Figura 47). Com mais de um objeto o mapa tem mais regies formadas
Captulo 5. EXPERIMENTOS EM RACIOCNIO ESPACIAL QUALITATIVO PROBABILSTICO PARA AUTO
148 LOCALIZAO DO ROB MVEL
pela sobreposio de regies. Os testes com mltiplas caixas serviram tambm para mostrar a
adaptabilidade do mtodo considerando relaes entre os elementos diferentes de sombra. Na
prxima seo (seo 5.4) os resultados relativos aos experimentos de auto localizao com REQ
probabilstico.
R1 R2 R3 R4 R5 R6 R7 R8 R9 R10 R11 R12 R13 R14 R15 R16 R17 R18 R19 R20 R21 R22 R23 R24 R25 R26 R27 R28
R1 0,839 0,054 0,107
R2 0,991 0,009
R3 0,007 0,971 0,022
R4 0,024 0,003 0,969 0,003
R5 0,208 0,703 0,089
R6 0,984 0,016
R7 0,207 0,034 0,736 0,011 0,011
R8 0,089 0,002 0,391 0,354 0,053 0,015 0,075 0,021
R9 1,000
R10 0,922 0,078
R11 0,992 0,008
R12 0,044 0,956
R13 0,021 0,925 0,054
R14 0,833 0,167
5.4. Resultados para Auto Localizao com Mltiplos Objetos
R15 1,000
R16 0,068 0,932
R17 0,129 0,002 0,530 0,099 0,001 0,001 0,004 0,221 0,013
R18 0,676 0,226 0,098
R19 0,087 0,739 0,109 0,043 0,022
R20 0,008 0,004 0,133 0,760 0,004 0,087 0,004
R21 0,971 0,029
R22 0,019 0,923 0,058
R23 0,054 0,018 0,875 0,054
R24 0,024 0,913 0,004 0,028 0,032
R25 1,000
R26 0,003 0,101 0,236 0,002 0,634 0,026
R27 0,016 0,690 0,284 0,002 0,008
R28 0,860 0,103 0,009 0,028
Fonte: autor.
149
Captulo 5. EXPERIMENTOS EM RACIOCNIO ESPACIAL QUALITATIVO PROBABILSTICO PARA AUTO
150 LOCALIZAO DO ROB MVEL
Tabela 17: Tabela com os valores de acurcia do sistema REQ probabilstico.
53,6% (5087) para o sistema utilizando somente o raciocnio espacial para inferncia e 58%
(5523) para o REQ com o filtro Bayesiano. As outras linhas da Tabela 17 so anlogas para
imagens com um, dois ou trs objetos.
A Tabela 18 tem os valores de acurcia detalhados por regio, as linhas tm informaes
sobre as regies especificadas na primeira coluna (Regies). A segunda coluna (#images)
referente ao total de imagens capturas em cada regio, enquanto que as quatro colunas seguintes
so referentes ao total de imagens pelo nmero de objetos visveis (#objetos na imagem). As
stima (REQ) e oitava (PREQ) colunas representam o total de vezes que os sistemas acertaram a
localizao, estes valores de acurcia tm sua representao em porcentagem nas nona (%REQ)
e dcima (%PREQ) colunas. Por exemplo na regio R18 foram capturadas 509 imagens todas
com um nico objeto e somente o REQ probabilstico conseguiu inferir corretamente em 22,6%
(115) das imagens.
A Tabela 19 refere-se somente as regies na qual ocorre ocluso e as imagens em que
somente um objeto aparece na imagem. A coluna regies so as regies onde ocorre a relao de
ocluso total entre um dos pares (T otallyOccludesN T P P, T otallyOccludesN T P P I 1 ). A
segunda coluna (#imagens com 1 objeto) tem os totais de imagens capturadas nessas regies em
que somente uma caixa aparece na imagem contudo existem duas caixas em cena. A coluna REQ
apresenta o total de vezes em que o sistema REQ acertou a localizao. Por fim, a ltima coluna
(PREQ) apresenta o total de vezes em que o sistema REQ probabilstico acertou a localizao do
rob. Como exemplo a ltima linha mostra que de 515 imagens em regio de ocluso total com
somente um objeto em 440 e 457 vezes a localizao foi inferida corretamente pelos sistemas
REQ sem e com filtro Bayesiano respectivamente.
Vamos fazer outra analise agora no que se refere localizao em regies prximas,
como uma resposta qualitativa caso uma regio prxima seja dada essa deve ser considerada. Na
matriz de confuso (Tabela 16) notem que em grande parte as respostas para a regio e vizinhas
ocorrem, por exemplo, considerando a vizinhana na regio R1 o sistema teria acertado em
todas as respostas. Mas vamos analisar considerando tambm o percurso, no caso em que o rob
tem como resposta uma regio que alm de vizinha aquela para a qual estava se deslocando.
A Tabela 20 mostra uma comparao de acurcia por regio, na ltima coluna (%PREQ Viz.)
representa os valores para o REQ probabilstico considerando esse percurso e a vizinhana, a
5.4. Resultados para Auto Localizao com Mltiplos Objetos 151
Tabela 18: Tabela com os valores de acurcia do sistema detalhado por regio.
#objetos na imagem
Regies #images 0 1 2 3 REQ PREQ %REQ %PREQ
R1 112 0 3 78 31 96 94 85,7% 83,9%
R2 115 0 55 60 0 115 114 100,0% 99,1%
R3 415 0 3 346 66 399 403 96,1% 97,1%
R4 290 0 0 46 244 281 281 96,9% 96,9%
R5 101 0 9 87 5 71 71 70,3% 70,3%
R6 64 0 64 0 0 46 63 71,9% 98,4%
R7 87 0 7 80 0 61 64 70,1% 73,6%
R8 1452 0 661 698 93 557 568 38,4% 39,1%
R9 194 1 193 0 0 0 194 0,0% 100,0%
R10 102 0 4 71 27 94 94 92,2% 92,2%
R11 124 0 50 74 0 124 123 100,0% 99,2%
R12 91 0 3 30 58 84 87 92,3% 95,6%
R13 240 0 0 105 135 220 222 91,7% 92,5%
R14 54 0 7 31 16 45 45 83,3% 83,3%
R15 162 0 148 14 0 162 162 100,0% 100,0%
R16 44 0 7 37 0 37 41 84,1% 93,2%
R17 1651 0 577 986 88 859 875 52,0% 53,0%
R18 509 0 509 0 0 0 115 0,0% 22,6%
R19 46 0 1 15 30 34 34 73,9% 73,9%
R20 263 0 103 160 0 201 200 76,4% 76,0%
R21 34 0 0 4 30 29 33 85,3% 97,1%
R22 52 0 0 0 52 48 48 92,3% 92,3%
R23 56 0 3 5 48 49 49 87,5% 87,5%
R24 252 0 95 157 0 231 230 91,7% 91,3%
R25 64 0 2 32 30 61 64 95,3% 100,0%
R26 1970 0 725 1109 136 1183 1248 60,1% 63,4%
R27 503 3 497 3 0 0 1 0,0% 0,2%
R28 436 295 141 0 0 0 0 0,0% 0,0%
Global 9483 299 3867 4228 1089 5087 5523 53,6% 58,2%
Fonte: autor.
Tabela 19: Tabela com os resultados de acurcia para o caso especfico das regies onde ocorre ocluso nas quais
somente um objeto aparecem na imagem.
Tabela 20: Resposta de total de imagens com resposta positiva para o REQ e o REQ probabilstico com o REQ
probabilstico considerando as regies vizinhas que estavam no percurso do rob como resposta positiva .
Regies #images REQ PREQ PREQ Viz. %REQ %PREQ %PREQ Viz.
1 112 96 94 110 85,7% 83,9% 98,2%
2 115 115 114 115 100,0% 99,1% 100,0%
3 415 399 403 412 96,1% 97,1% 99,3%
4 290 281 281 283 96,9% 96,9% 97,6%
5 101 71 71 80 70,3% 70,3% 79,2%
6 64 46 63 63 71,9% 98,4% 98,4%
7 87 61 64 66 70,1% 73,6% 75,9%
8 1452 557 568 1159 38,4% 39,1% 79,8%
9 194 0 194 194 0,0% 100,0% 100,0%
10 102 94 94 102 92,2% 92,2% 100,0%
11 124 124 123 124 100,0% 99,2% 100,0%
12 91 84 87 91 92,3% 95,6% 100,0%
13 240 220 222 237 91,7% 92,5% 98,8%
14 54 45 45 54 83,3% 83,3% 100,0%
15 162 162 162 162 100,0% 100,0% 100,0%
16 44 37 41 44 84,1% 93,2% 100,0%
17 1651 859 875 1033 52,0% 53,0% 62,6%
18 509 0 115 115 0,0% 22,6% 22,6%
19 46 34 34 45 73,9% 73,9% 97,8%
20 263 201 200 224 76,4% 76,0% 85,2%
21 34 29 33 33 85,3% 97,1% 97,1%
22 52 48 48 52 92,3% 92,3% 100,0%
23 56 49 49 52 87,5% 87,5% 92,9%
24 252 231 230 231 91,7% 91,3% 91,7%
25 64 61 64 64 95,3% 100,0% 100,0%
26 1970 1183 1248 1294 60,1% 63,4% 65,7%
27 503 0 1 129 0,0% 0,2% 25,6%
28 436 0 0 245 0,0% 0,0% 56,2%
Global 9483 5087 5523 6813 53,6% 58,2% 71,8%
Fonte: autor.
Tabela 21: Comparao que tem os valores de acurcia pelo total de objetos contidos na imagem, considerando a
regio vizinha que estava no percurso executado pelo rob como resposta positiva.
coluna PREQ Viz. tem o nmero de imagens com resultado positivo. Os valores para o REQ
e o REQ probabilstico esto nas colunas adjacentes para comparao, essa tabela similar a
Tabela 18. Neste caso o resultado geral representado na ltima linha da Tabela 20 passou de
58, 2% para 71, 8%. Notem que desse modo o desempenho na regio R1 de 98, 2% nem sempre
a regio vizinha aquela na qual o rob est se dirigindo.
Outra tabela para comparao que tem os valores de acurcia pelo total de objetos
contidos na imagem, semelhante Tabela 17 e a Tabela 21, onde na coluna REQ probabilstico
vizinhana esto os valores de acurcia considerando o percurso e a vizinhana. Para o filtro
Bayesiano, a falta de objeto na imagem faz com que todas as regies sejam analisadas, assim o
modelo de transio e a crena posterior (previso) so o que decide qual regio, o que acredito
elevou para um acerto (ou regio do percurso) de 70, 9%, quando com uma caixa, algumas
regies no so analisadas (onde ocorre a ocluso total da caixa que est na imagem), assim
ocorre casos em que a crena em uma regio vizinha diferente daquela que o rob est realmente
se deslocando ocorre, por isso a acurcia ficou em torno de 44, 1%, para as imagens com mais
informaes desempenho foi superior a 90%.
5.5 Discusso
Neste captulo foram apresentados dois sistemas de auto localizao aplicado em sistema
robtico. Esses sistemas executam de modo automtico os algoritmos que executam tarefas
semelhantes como: primeiro reconhecer e extrair as caractersticas dos elementos alvos em
uma imagem; segundo utilizar o raciocnio espacial qualitativo para extrair as relaes entre os
elementos; para em seguida com a formalizao do domnio e com os clculos de raciocnio
espacial inferir informaes a partir das imagens, e utilizar essas informaes como evidncias
em um filtro Bayesiano. A crena com maior valor a resposta do sistema, podendo tambm
atuar na definio de parmetros como foi o caso do sistema de viso para segmentao de
sombras e objetos. O filtro Bayesiano desempenha um papel relevante principalmente na acurcia
das respostas quando as informaes dos sensores foram incompletas ou inexistentes.
O sistema de PQRS probabilstico utilizou o filtro Bayesiano tanto para auto localizao
como para auto calibrao. Quando tratando com sombras, o sistema de viso necessita de uma
calibrao diferente conforme muda de posio no ambiente, elevando o grau de incerteza das
informaes das imagens. Um sistema de calibrao com PQRS precisa saber qual regio onde
est localizado, para encontrar um parmetro de viso que confirme essa informao. Enquanto
que o PQRS probabilstico trabalha com a crena na regio, e tanto a regio quanto o parmetro
que tm maior valor de crena so escolhidos como resposta do sistema. No ambiente com caixas
a incerteza ocorre principalmente devido a informao parcial ou inexistente sobre os pares de
objetos.
Captulo 5. EXPERIMENTOS EM RACIOCNIO ESPACIAL QUALITATIVO PROBABILSTICO PARA AUTO
154 LOCALIZAO DO ROB MVEL
qual o movimento percebido atravs da alterao nas caractersticas percebidas nas imagens,
porm neste experimento perceber o transio atravs da mudana de relao espacial entre pares
foi prejudicada pelo alto nmero de imagens sem pares. A Tabela 18 mostra que em algumas
regies nenhuma imagem foi capturada com pares.
Outro motivo que causa essa diferena, que ao realizar a captura da sequncia de
imagens, nossa ateno foi que o rob passasse por todas as regies sem atentar para o fato
que em algumas no foram mantidos os pares no campo de viso. O filtro Bayesiano fez o que
foi proposto, capacitando o sistema de raciocnio espacial qualitativo a lidar com informaes
parciais. Na Tabela 16 a maior parte dos resultados foi ou a regio ou uma regio prxima
regio que o rob estava localizado. Nas Tabelas 20 e 21 mostram como o filtro fez o trabalho e
com alguns ajuste pode ficar mais eficaz.
As imagens com somente um objeto visvel so as informaes parciais tpicas do
experimento de auto localizao no mapa da Figura 46. Isso porque com exceo dos casos em
que ocorre uma ocluso total em cena, com apenas um objeto um sistema utilizando somente o
REQ no capaz de inferir uma localizao. Com o filtro Bayesiano o sistema pode obter alguns
resultados positivos na auto localizao com informao parcial da imagem. Isso fica evidente
quando comparamos a Tabela 17 na linha referente a um nico objeto na imagem com a ltima
linha da Tabela 19. Os resultados utilizando REQ so os mesmos 440 nas duas tabelas, como
esperado j que o mecanismo de inferncia REQ utiliza relaes espaciais dos pares percebidas
em cenas. O sistema REQ probabilstico acertou a localizao em 817 imagens, das quais 457
so referentes s regies onde uma relao espacial de ocluso total ocorre entre os objetos.
Assim, o REQ probabilstico mesmo com informao parcial foi capaz de inferir corretamente a
localizao em 360 casos.
157
6 CONCLUSO
autnoma, e isso pode levar o sistema a melhorar a sua acurcia. Comeamos a perceber como o
diagrama conceitual de vizinhana e tabela de composio so teis nas aplicaes de raciocnio
espacial qualitativo com tcnicas probabilsticas.
Um sistema foi construdo de modo a permitir que o rob se localize relativo ao espao
onde se encontra a partir dos objetos que sejam referncia. Esse sistema possibilita o avano
para um sistema em que o rob atue em seu autocontrole, modificando a suas crenas, essa
hiptese vem do fato de termos obtidos resultados bons na auto calibrao da imagem. Imagem
tem um grande nmero de possibilidades e pode ser utilizada principalmente como suporte para
desambiguao ou aumentar o que percebido por outros sensores, para que o tempo de ao de
um rob seja melhorado. Deste modo os mtodos espaciais qualitativos devem ser utilizados
no como substitutos dos algoritmos numricos tradicionais, mas como complemento de modo
a adicionar um nvel de raciocnio em situaes em que as informaes numricas no esto
disponveis.
Estamos dando pequenos passos na direo de robs que possam conviver e interagir de
modo mais natural e intuitivo com humanos. A abordagem com raciocnio espacial qualitativo
probabilstico aqui proposta no a soluo final, mas espero que seja parte de um mecanismo
que permita no futuro uma boa interao entre homens e mquinas prxima ou igual aquelas
vistas na fico. Existem vrios possveis trabalhos futuros derivados desta pesquisa.
Seria importante realizar os experimentos da seo de auto localizao com mltiplos
objetos, com um modelo de imagem mais completo, com dados anotados durante a captura de
imagens. Analisar a complexidade dos mtodos de raciocnio espacial qualitativo probabilstico
aqui utilizados. E aplicar mtodos de programao que melhorem o desempenho em velocidade
de processamento dos algoritmos utilizados pelo rob autnomo. Passar esse cdigo para um
sistema que opere com o rob em tempo real.
Desenvolver o sistema de modo que o filtro Bayesiano combinado com os mtodos
de raciocnio espacial qualitativo seja utilizado para modificar parmetros de controle que
determinem a atuao do rob no ambiente tornando esse autnomo. Para uma navegao alm
do sistema de localizao outros pontos importantes ainda devem ser desenvolvidos. A navegao
autnoma exige tomada de deciso, quando em determinada regio necessrio ir para outra
regio, a percepo espacial indicar se as mudanas esto ocorrendo na direo certa.
Uma prxima aplicao do sistema de raciocnio espacial qualitativo probabilstico
integrar com outros mtodos de localizao robtica para formar um sistema mais robusto e
eficiente para a tarefa de localizao. A ideia que o mtodo de auto localizao qualitativa
sirva como heurstica para os mtodos probabilsticos atuais. Tambm desenvolver um algoritmo
de localizao e mapeamento qualitativo simultneo com nosso atual algoritmo de localizao.
Esses mapas qualitativos poderiam ser utilizados em sistema com dois robs, onde um rob tem
acesso visual a regio que o outro no tem. Utilizar as ferramentas que fazem o mapeamento
159
qualitativo tambm para traduzir para um significado semntico que torne o sistema capaz de
realizar uma comunicao homem-rob.
A percepo de movimento atravs da imagem agrega informao. Devemos utilizar os
sensores do rob que indicam o movimento para deixar os modelos de transio mais robustos.
Alm de que novas inferncias podem ser formalizadas a partir das mudanas de relaes
percebidas relativas ao ambiente e aquelas do prprio rob. Prevendo a ao de outros elementos
que estejam inseridos no ambiente, ou seja, comear a expandir o sistema para ser utilizados em
ambientes dinmicos. Como o ambiente de trfego utilizado neste trabalho utilizando CRALC
para inferir a localizao do veculo.
Para a aplicao do CRALC em robtica mvel seria necessrio fazer algumas alteraes:
a criao de uma regra para que ao tratar com a transitividade de uma composio de relaes,
para que essas pudessem ser definidas no banco de conhecimento; ou utilizar uma lgica de
descrio mais completa que permita a composio. Uma dificuldade inicial para a formalizao
com o CRALC foi evitar ciclos, em que cada conceito e papel deveriam ser definidos em uma
sequncia tal, que um conceito que esteja direita tenha sido definido anteriormente. Um trabalho
futuro poderia estender a linguagem de modo tal que ela mesma procuraria a melhor sequncia,
mostrando de forma mais intuitiva quando um ciclo ocorreu.
161
REFERNCIAS
BAADER, F.; NUTT, W. Basic description logics. In: Description Logic Handbook. [S.l.]:
Cambridge University Press, 2002. p. 47100. Citado na pgina 65.
BACCHUS, F.; GROVE, A.; HALPERN, J. Y.; KOLLER, D. From statistical knowledge bases
to degrees of belief. Artificial Intelligence, v. 87, p. 75143, 1996. Citado na pgina 31.
CHEN, J.; COHN, A. G.; LIU, D.; WANG, S.; OUYANG, J.; YU, Q. A survey of qualitative
spatial representations. The Knowledge Engineering Review, Cambridge Univ Press, p. 131,
2013. Citado 3 vezes nas pginas 30, 37 e 38.
CHEN, S. Kalman filter for robot vision: a survey. Industrial Electronics, IEEE Transactions on,
IEEE, v. 59, n. 11, p. 44094420, 2012. Citado na pgina 70.
COZMAN, F. G.; CAMPOS, C. P. D.; IDE, J. S.; ROCHA, J. C. F. da. Propositional and
relational Bayesian networks associated with imprecise and qualitative probabilistic assessments.
In: AUAI PRESS. Proceedings of the 20th conference on Uncertainty in artificial intelligence.
[S.l.], 2004. p. 104111. Citado na pgina 62.
CRISTANI, M.; GABRIELLI, N. Practical issues of description logics for spatial reasoning.
In: AAAI Spring Symposium: Benchmarking of Qualitative Spatial and Temporal Reasoning
Systems. [S.l.: s.n.], 2009. p. 510. Citado na pgina 34.
CUI, Z.; COHN, A. G.; RANDELL, D. A. Qualitative simulation based on a logical formalism
of space and time. In: AAAI. [S.l.: s.n.], 1992. p. 679684. Citado 2 vezes nas pginas 39 e 118.
162 REFERNCIAS
DMATO, C.; FANIZZI, N.; LUKASIEWICZ, T. Tractable reasoning with bayesian description
logics. In: Scalable Uncertainty Management. [S.l.]: Springer, 2008. p. 146159. Citado na
pgina 31.
DELLAERT, F.; FOX, D.; BURGARD, W.; THRUN, S. Monte carlo localization for mobile
robots. In: IEEE. IEEE International Conference on Robotics and Automation. [S.l.], 1999. v. 2,
p. 13221328. Citado na pgina 70.
DING, Z.; PENG, Y. A probabilistic extension to ontology language OWL. In: IEEE.
Proceedings of the 37th Annual Hawaii international conference onSystem Sciences. [S.l.], 2004.
p. 10pp. Citado na pgina 64.
DING, Z.; PENG, Y.; PAN, R. BayesOWL: Uncertainty modeling in semantic web ontologies.
In: Soft Computing in Ontologies and Semantic Web. Berlin/Heidelberg: Springer, 2006, (Studies
in Fuzziness and Soft Computing, v. 204). p. 329. ISBN 978-3-540-33472-9. Citado na pgina
64.
DRIG, M.; STUDER, T. Probabilistic ABox reasoning: preliminary results. In: Description
Logics. [S.l.: s.n.], 2005. p. 104111. Citado 2 vezes nas pginas 31 e 63.
FENELON, V.; HUMMEL, B.; SANTOS, P. E.; COZMAN, F. G. Encoding spatial domains
with relational bayesian networks. In: UAI 2010. [S.l.: s.n.], 2010. p. 4954. Citado 18 vezes
nas pginas 31, 32, 33, 34, 40, 66, 72, 80, 81, 82, 86, 87, 92, 93, 94, 95, 138 e 173.
FENELON, V.; SANTOS, P.; DEE, H.; COZMAN, F. Reasoning about shadows in a mobile
robot environment. Applied Intelligence, Springer US, p. 113, 2012. ISSN 0924-669X. Citado
9 vezes nas pginas 33, 34, 51, 99, 100, 101, 108, 146 e 173.
FOX, D.; BURGARD, W.; THRUN, S. Markov localization for mobile robots in dynamic
environments. Journal of Artificial Intelligence Research, v. 11, p. 391427, 1999. Citado na
pgina 70.
REFERNCIAS 163
FREKSA, C. Using orientation information for qualitative spatial reasoning. In: Theories and
Methods of Spatial-Temporal Reasoning in Geographic Space. [S.l.]: Springer-Verlag, 1992,
(LNCS, v. 629). Citado na pgina 38.
FUHR, N. Probabilistic datalog a logic for powerful retrieval methods. In: Conference
on Research and Development in Information Retrieval. Seattle, Washington: [s.n.], 1995. p.
282290. Citado 2 vezes nas pginas 63 e 64.
FUKUSHIGE, Y. Representing probabilistic knowledge in the semantic web. In: W3C Workshop
on Semantic Web for Life Sciences. Cambridge, MA: [s.n.], 2004. Citado na pgina 63.
GALTON, A. Lines of sight. In: Proc. of the Seventh Annual Conference of AI and Cognitive
Science. Dublin, Ireland: [s.n.], 1994. p. 103113. Citado 2 vezes nas pginas 40 e 45.
GETOOR, L.; TASKAR, B. Introduction to Statistical Relational Learning. [S.l.]: MIT Press,
2007. ISBN 0262072882. Citado na pgina 64.
GOTTS, N. M. How far can we C? defining a doughnut using connection alone. In: DOYLE,
J.; SANDEWALL, E.; TORASSO, P. (Ed.). KR94: Principles of Knowledge Representation and
Reasoning. San Francisco, California: Morgan Kaufmann, 1994. p. 246257. Citado na pgina
38.
GUO, P.; ZHANG, R.-x. Spatial topology relationships concrete domain and consistency
determination. In: IEEE. Information Engineering, 2009. ICIE09. WASE International
Conference on. [S.l.], 2009. v. 1, p. 611614. Citado na pgina 34.
HANSEN, P.; JAUMARD, B. Probabilistic satisfiability. [S.l.], 1996. Citado na pgina 63.
HERMAN, D. Spatial cognition in natural-language narratives. In: Proceedings of the AAAI Fall
Symposium on Narrative Intelligence. [S.l.: s.n.], 1999. p. 2125. Citado na pgina 30.
HOLI, M.; HYVNEN, E. Modeling degrees of conceptual overlap in semantic web ontologies.
In: Uncertainty Reasoning for the Semantic Web. [S.l.: s.n.], 2005. p. 9899. Citado na pgina
63.
HUMMEL, B. Dynamic and mobile gis: Investigating changes in space and time. In: .
[S.l.]: CRC Press, 2006. cap. Map Matching for Vehicle Guidance. Citado 2 vezes nas pginas
79 e 80.
HUMMEL, B. Description Logic for Intersection Understanding at the Example of Urban Road
Intersections. Tese (Doutorado) University of Karlsruhe, April 2009. Citado 4 vezes nas
pginas 32, 64, 71 e 81.
KANDA, T.; KAMASIMA, M.; IMAI, M.; ONO, T.; SAKAMOTO, D.; ISHIGURO, H.;
ANZAI, Y. A humanoid robot that pretends to listen to route guidance from a human. Springer
Science + Business Media, LLC 2006, Auton Robot, September 2006. Citado na pgina 38.
KERSTEN, D.; MAMASSIAN, P.; KNILL, D. C. Moving cast shadows and the perception of
relative depth. Max-Planck-Institut fuer biologische Kybernetik, Technical Report No.6, JUNE
1994. Disponvel em: <ftp://ftp.mpik-tueb.mpg.de/pub/mpi-memos/TR-006.ps.Z>. Citado 2
vezes nas pginas 47 e 48.
KNILL, D. C.; MAMASSIAN, P.; KERSTEN, D. Geometry of shadows. Journal of the Optical
Society of America A, v. 14, p. 32163232, 1997. Citado na pgina 46.
KORB, K.; NICHOLSON, A. E. Bayesian Artificial Intelligence. Boca Raton, FL, USA: CRC
Press, Inc., 2003. ISBN 1584883871. Citado na pgina 62.
KRUSE, T.; PANDEY, A. K.; ALAMI, R.; KIRSCH, A. Human-aware robot navigation: A
survey. Robotics and Autonomous Systems, Elsevier, v. 61, n. 12, p. 17261743, 2013. Citado
na pgina 69.
LASKEY, K. B.; COSTA, P. C. G. da. Of starships and klingons: Bayesian logic for the 23rd
century. CoRR, abs/1207.1354, p. abs/1207.1354, 2012. Citado 2 vezes nas pginas 31 e 64.
LEVITT, T. S.; LAWTON, D. T. Qualitative navigation for mobile robots. Artificial intelligence,
Elsevier, v. 44, n. 3, p. 305360, 1990. Citado na pgina 69.
MAMASSIAN, P.; GOUTCHER, R. Prior knowledge on the illumination position. In: Cognition.
[S.l.]: Elsevier, 2001. v. 81, n. 1, p. 19(9). Citado na pgina 139.
MAMASSIAN, P.; KNILL, D. C.; KERSTEN, D. The perception of cast shadows. Trends in
cognitive Sciences, v. 2, n. 8, p. 288295, August 1998. Citado na pgina 47.
MCCALL, J. C.; TRIVEDI, M. M. Video-based lane estimation and tracking for driver
assistance: Survey, system, and evaluation. IEEE Transactions on Intelligent Transportation
Systems, v. 7:1, p. 2037, 2006. Citado na pgina 71.
MILCH, B.; RUSSELL, S. First-order probabilistic languages: into the unknown. In:
International Conference on Inductive Logic Programming. [S.l.: s.n.], 2007. Citado 2 vezes
nas pginas 31 e 64.
MITRA, P.; NOY, N. F.; JAISWAL, A. OMEN: A probabilistic ontology mapping tool. In: ISWC.
[S.l.: s.n.], 2005. p. 537547. Citado na pgina 63.
MORATZ, R.; RENZ, J.; WOLTER, D. Qualitative spatial reasoning about line segments. In:
ECAI. [S.l.: s.n.], 2000. p. 234238. Citado na pgina 38.
NAGEL, H.-H. Image sequence evaluation: 30 years and still going strong. In: Proc. of ICPR.
Barcelona, Spain: [s.n.], 2000. p. 11491158. Citado na pgina 71.
NEHMZOW, U. Mobile robotics: a practical introduction. [S.l.]: Springer Verlag, 2003. Citado
2 vezes nas pginas 37 e 69.
NEUMANN, B.; MLLER, R. On scene interpretation with description logics. Image and
Vision Computing, Special Issue on Cognitive Vision, Elsevier, v. 26, n. 1, p. 82101, 2008.
Citado na pgina 71.
NIKOLOV, A.; UREN, V.; MOTTA, E.; ROECK, A. de. Using the Dempster-Shafer theory
of evidence to resolve ABox inconsistencies. In: Workshop on Uncertainty Reasoning for the
Semantic Web. [S.l.: s.n.], 2007. Citado 2 vezes nas pginas 31 e 63.
NILSSON, N. J. Probabilistic logic. Artif. Intell., v. 28, n. 1, p. 7187, 1986. Citado na pgina
64.
NOTTELMANN, H.; FUHR, N. Adding probabilities and rules to OWL lite subsets based on
probabilistic datalog. International Journal of Uncertainty, Fuzziness and Knowledge-based
Systems, v. 14, n. 1, p. 1742, 2006. Citado na pgina 64.
PIRRI, F.; MENTUCCIA, I.; STORRI, S. The domestic robot: A friendly cognitive system takes
care of your home. In: BASTEN, T.; GEILEN, M. C. W.; GROOT, H. W. H. de (Ed.). Ambient
Intelligence: Impact on Embedded System Design. [S.l.]: Kluwer Academic Publishers, 2003.
Citado na pgina 37.
POLASTRO, R.; CORRA, F.; COZMAN, F.; JR, J. O. Semantic mapping with a probabilistic
description logic. SBIA, 2010. Citado na pgina 69.
REFERNCIAS 167
SANTOS, P.; SHANAHAN, M. Hypothesising object relations from image transitions. In:
HARMELEN, F. van (Ed.). Proc. of ECAI-02. Lyon, France: [s.n.], 2002. p. 292296. Disponvel
em: <citeseer.ist.psu.edu/532993.html>. Citado na pgina 38.
SANTOS, P.; SHANAHAN, M. Hypothesising object relations from image transitions. In:
HARMELEN, F. van (Ed.). Proc. of ECAI. Lyon, France: [s.n.], 2002. p. 292296. Citado na
pgina 71.
SANTOS, P.; SHANAHAN, M. A logic-based algorithm for image sequence interpretation and
anchoring. In: Proc. of IJCAI. Acapulco, Mexico: [s.n.], 2003. p. 14081410. Citado na pgina
71.
SANTOS, P. E. Reasoning about depth and motion from an observers viewpoint. Spatial
Cognition and Computation, v. 7, n. 2, p. 133178, 2007. Citado na pgina 71.
SCHULZ, R.; GLOVER, A.; MILFORD, M. J.; WYETH, G.; WILES, J. Lingodroids: Studies
in spatial cognition and language. In: IEEE. Robotics and Automation (ICRA), 2011 IEEE
International Conference on. [S.l.], 2011. p. 178183. Citado na pgina 30.
SHANAHAN, M. Robotics and the common sense informatic situation. In: Proc. of ECAI.
Budapest, Hungary: [s.n.], 1996. p. 684688. Citado na pgina 71.
SHAPIRO, L. G.; STOCKMAN, G. C. Computer Vision. [S.l.]: Tom Robbins, 2001. 371-409 p.
Citado 3 vezes nas pginas 73, 74 e 75.
SHIRAZI, A.; AMIR, E. Probabilistic modal logic. In: AAAI07: Proceedings of the 22nd
national conference on Artificial intelligence. [S.l.]: AAAI Press, 2007. p. 489495. ISBN
978-1-57735-323-2. Citado na pgina 30.
REFERNCIAS 169
SJ, K.; AYDEMIR, A.; JENSFELT, P. Topological spatial relations for active visual search.
Robotics and Autonomous Systems, Elsevier, v. 60, n. 9, p. 10931107, 2012. Citado 2 vezes
nas pginas 34 e 35.
STAKER, R. Reasoning in expressive description logics using belief networks. In: International
Conference on Information and Knowledge Engineering. Las Vegas, USA: [s.n.], 2002. p.
489495. Citado na pgina 64.
STOCK, O. Spatial and Temporal Reasoning. Norwell, MA, USA: Kluwer Academic Publishers,
1997. ISBN 0792346440. Citado 4 vezes nas pginas 30, 37, 38 e 39.
STRACCIA, U. Description logics with fuzzy concrete domains. In: Conference on Uncertainty
in Artificial Intelligence. [S.l.: s.n.], 2005. Citado na pgina 63.
THRUN, S. Robotic mapping: A survey. Exploring artificial intelligence in the new millennium,
Morgan Kaufmann San Mateo, CA, p. 135, 2002. Citado 2 vezes nas pginas 31 e 70.
THRUN, S.; BURGARD, W.; FOX, D. et al. Probabilistic robotics. [S.l.]: MIT press Cambridge,
2005. Citado 5 vezes nas pginas 29, 31, 59, 60 e 70.
UDREA, O.; SUBRAHMANIAN, V. S.; MAJKIC, Z. Probabilistic RDF. In: IEEE International
Conference on Information Reuse and Integration. [S.l.: s.n.], 2006. p. 172177. Citado na
pgina 63.
VINCI, L. da. The Notebooks of Leonardo da Vinci. [S.l.]: Dover, 1970. Citado na pgina 46.
WITKOWSKI, M.; SHANAHAN, M.; SANTOS, P.; RANDELL, D. Cognitive robotics: On the
semantic knife-edge. In: Towards Intelligent Mobile Robots. [S.l.: s.n.], 2001. Citado 2 vezes
nas pginas 45 e 46.
GLOSSRIO
Encoding spatial domains with relational Bayesian networks (FENELON et al., 2010).
search is the main contribution of the present work, and to the best of our
knowledge this is the first work that uses qualitative spatial representations both
to perform egolocation and to calibrate a robots interpretation of its perceptual
input.