You are on page 1of 166

INPE-14439-TDI/1134

RECONHECIMENTO DE FACES USANDO REDES NEURAIS E BIOMETRIA

Douglas Rodrigues Oliveira

Dissertao de Mestrado do Curso de Ps-Graduao em Computao Aplicada, orientada pelo Dr. Lamartine Nogueira Frutuoso Guimares, aprovada em 30 de setembro de 2003.

INPE So Jos dos Campos 2006

681.3.019 Oliveira, D. R. Reconhecimento de faces usando redes neurais e biometria/ D. R. Oliveira. So Jos dos Campos: Instituto Nacional de Pesquisas Espaciais (INPE), 2003. 164 p.; - (INPE-14439-TDI/1134) 1. Reconhecimento de Faces. 2. Biometria. 3. Tipos Faciais. 4. Morfologia Facial. 5. Redes Neurais. 6. Inteligncia Artificial. I.Ttulo.

Aprovado pela Banca Examinadora em cumprimento a requisito exigido para a obteno do Ttulo de Mestre em Computao Aplicada

Dr. Jos Demisio Simes da Silva Presidente Dr. Lamartine Nogueira Frutuoso Guimares Orientador Dra. Sandra Aparecida Sandri Membro da Banca Dr. Walmir Matos Caminhas Membro da Banca Convidado

Candidato: Douglas Rodrigues Oliveira

So Jos dos Campos, 30 de setembro de 2003.

Ningum igual a ningum. Todo ser humano um estranho mpar. Carlos Drummond de Andrade

A meus pais, VICENTE DE PAULO OLIVEIRA e MARIA DAS GRAAS RODRIGUES OLIVEIRA .

AGRADECIMENTOS

Inicialmente, agradeo ao meu orientador Dr. Lamartine pelo empenho, incentivo, compreenso e pelas crticas dispensadas na orientao deste trabalho, mesmo quando outras atividades profissionais e de cunho pessoal lhe exigiam intensa dedicao. Agradeo aos meus colegas de repblica, Felipe, Mic e Joubert pelo companheirismo nas dificuldades do dia a dia. Tambm gostaria de lembrar os colegas conquistados no Laboratrio da CAP e em So Jos dos Campos, Maurcio, Fernanda, lcio, Ana Paula, Fabrcio, Talita, Adytia, Aritana, Juliana, Jaciara, Patrcia e todos os que de alguma forma foram fonte de inspirao, apoio e incentivo. Especialmente, agradeo aos amigos Maurcio e lcio pelos inmeros favores e por toda amizade demonstrada por eles e pelas suas respectivas famlias durante o perodo em que residi em So Jos dos Campos. Ao chefe da rea de Sistemas Industriais da Aominas S.A., Mrio Hermes de Rezende, pelo incentivo dado para a concluso desta dissertao e por ter sido extremamente tolerante com a minha necessria dedicao escrita deste trabalho. Aos colegas de empresa Marlon Gouvea e Eduardo Vieira que deram contribuies importantes para escrita desta dissertao. Ao Instituto Nacional de Pesquisas Espaciais e CAP, pelo apoio, considerao e empenho em prover seus alunos com as condies necessrias para o desenvolvimento da pesquisa cientfica. Especialmente gostaria de citar: Dr. Haroldo e Dr. Demsio que por tantas vezes me receberam e buscaram os rgos de financiamento para obteno de bolsas para os alunos da CAP. Minha profunda gratido a Rafaella, cujo carinho, compreenso e auxlio, buscando referncias bibliogrficas na rea de Fonoaudiologia, tambm foram de grande valia para este trabalho. Finalmente, agradeo minha me e a meus irmos, pelo amor e incentivo, e ao meu pai, que sempre me apoiou em todas as etapas e decises que tomei em relao a este mestrado.

RESUMO O reconhecimento de faces uma das aes mais corriqueiras no dia a dia de um ser vivo inteligente. Esta atividade executada com tanta naturalidade por organismos vivos, tem despertado o interesse de pesquisadores que trabalham com Viso Computacional e Inteligncia Artificial. Esta dissertao tem por objetivo pesquisar a viabilidade de um sistema hbrido aplicado ao reconhecimento facial, mesclando caractersticas dos mtodos geomtricos para o reconhecimento de faces, aos mtodos de inteligncia computacional. Para a extrao das mtricas de componentes e regies da face, usadas no mtodo geomtrico, foram feitos estudos sobre a anatomia da face humana usados em ortodontia, fonoaudiologia e reconstituio maxilo- facial. Estes estudos visaram a determinao de pontos de referncia existentes na face e suas relaes de interdependncia para construir uma representao para as faces a serem analisadas. As medidas dos componentes e regies faciais foram usadas na construo de vetores numricos que identificam as faces de forma singular. Estes vetores de caractersticas mtricas foram usados para treinar redes neurais, encarregadas de realizar o reconhecimento. Foram usadas, nos testes de reconhecimento, 37 imagens frontais de faces humanas de homens e mulheres adultos. Medidas de desempenho so utilizadas sob diversas condies (presena de rudo e imagens no vistas na etapa de treinamento), para ilustrar a viabilidade do sistema hbrido proposto, bem como a eficincia das mtricas usadas para representar as faces.

FACE RECOGNITION USING NEURAL NETWORKS AND BIOMETRY

ABSTRACT The recognition of faces is one of the simplest actions on a daily basis of an intelligent and living being. This activity performed so naturally by living organisms has been attracting the interest of researchers who work with Computer Vision and Artificial Intelligence. This dissertation has as the objective to study the feasibility of a system based on Neural Network and Biometry applied to face recognition, mixing characteristics of geometric methods for face recognition to computer intelligence methods. For the extraction of measurements of components and regions of the face, used in geometric method studies were developed of the anatomy of the human face used in orthodontist work, phonoaudiology and maxillary facial reconstitution. These studies seek to determine the existing reference points on faces and its interdependent relation to construct a representation of the faces to be analyzed. The components measurements and facial regions were used to construct numerical vectors, which identity the faces in a singular way. These vectors of characteristics were used for training neural networks, which are in charge of performing the recognition. 37 frontal face images of adult men and women were used. Performance measurements are used under various conditions (presence of noise and images not-seen during the training phase) in order to illustrate the feasibility of the proposed hybrid system as well as the efficiency of the metrics used to represent the faces.

SUMRIO
Pg. LISTA DE FIGURAS LISTA DE TABELAS CAPTULO 1 - INTRODUO ................................................................................. 21 1.1. 1.2. 1.3. 1.4. 1.5. 1.6. A Deteco de Faces...................................................................................... 23 O Reconhecimento de Faces ........................................................................ 26 Mtodos Geomtricos para Reconhecimento Facial ................................. 28 Objetivos desta dissertao .......................................................................... 31 Aplicaes ...................................................................................................... 32 Organizao ................................................................................................... 33

CAPTULO 2 - MTODOS CONEXIONISTAS NO LINEARES ....................... 35 2.1. Redes Neurais Artificiais .............................................................................. 36 2.1.1. Introduo ................................................................................................... 36 2.1.2. Definies ................................................................................................... 37 2.2. Redes multicamadas no- lineares ............................................................... 42 2.2.1. O processo de aprendizado ......................................................................... 44 2.3. Implementando um reconhecedor neural .................................................. 47 2.3.1. Etapa de descrio ...................................................................................... 48 2.3.2. Etapa de reconhecimento ............................................................................ 50 2.4. 3.1. 3.2. Concluses ..................................................................................................... 51 Introduo ..................................................................................................... 53 Arquitetura do Esqueleto Facial ................................................................. 56 CAPTULO 3 - MORFOLOGIA DA FACE HUMANA .......................................... 53

3.3. Antropometria Facial ................................................................................... 59 3.3.1. Pontos Craniomtricos ................................................................................ 60 3.3.2. Medidas Lineares ........................................................................................ 62 3.3.3. ndice Facial................................................................................................ 63 3.4. Esttica Facial ............................................................................................... 65 3.4.1. Tipos Morfolgicos .................................................................................... 66 3.4.2. Estruturas e Referncias Faciais ................................................................. 71 3.4.3. Anlise Facial ............................................................................................. 71 CAPTULO 4 - METODOLOGIA APLICADA ....................................................... 77 4.1. Introduo ..................................................................................................... 77

4.2. 4.3. 5.1. 5.2.

Descrio das etapas ..................................................................................... 78 Descrio das estruturas utilizadas ............................................................. 88 Testes realizados na rede da etapa de Reconhecimento .......................... 104 Testes da rede de associao a padres conhecidos ................................. 128

CAPTULO 5 - TESTES REALIZADOS ................................................................ 101

5.3. Discusso sobre os testes realizados .......................................................... 133 5.3.1. As Mtricas Usadas para Representao Facial ....................................... 134 5.3.2. Mtodo conexionis ta No- Linear Usado .................................................. 137 5.4. Resultados Obtidos ..................................................................................... 139 5.4.1. Comparao entre ndices de reconhecimento ......................................... 140 5.5. Aplicabilidade do Trabalho ....................................................................... 141 CAPTULO 6 - CONCLUSES E PERSPECTIVAS PARA TRABALHOS FUTUROS ........................................................................................ 143 Perspectivas para trabalhos futuros ..................................................................... 148 REFERNCIAS BIBLIOGRFICAS ...................................................................... 149

LISTA DE FIGURAS Pg. 1.1 - Etapas iniciais do processo de Viso Computacional, obtendo como resultado parcial uma imagem contendo o objeto de interesse do sistema.. ...................... 22 1.2 - Etapas finais do processo de Viso Computacional. .............................................. 22 1.3 - Etapas do problema de reconhecimento automtico de faces. .............................. 26 2.1 - Funcionamento bsico de um elemento de processamento em uma rede neural artificial. ................................................................................................................. 36 2.2 - Exemplo de topologias bsicas de redes neurais .................................................... 38 2.3 - Camadas de uma rede neural artificial multicamadas. ........................................... 41 2.4 - Topologia de rede multicamada para extrao de caractersticas. ......................... 43 3.1 - Regies da face. ...................................................................................................... 55 3.2 - Arquitetura do esqueleto facial. .............................................................................. 57 3.3 - . Linhas de Resistncia da mandbula. ................................................................... 59 3.4 - Pontos craniomtricos. ........................................................................................... 61 3.5 - Face Euriprospica ................................................................................................. 64 3.6 - Face Leptoprospica. .............................................................................................. 64 3.7 - A face humana segundo a concepo artstica de Drer. ....................................... 67 3.8 - Tipos faciais segundo Madame Schimmelpennick em seu livro "Cincia da Beleza". ............................................................................................................... 68

3.9 - Tipos morfolgicos segundo a classificao de Claud Sigaud. .............................. 69 3.10 - Posio natural da cabea. .................................................................................... 72 3.11 - Tpicos a serem avaliados na viso frontal. ......................................................... 73 3.12 - Diviso da face em duas partes. ........................................................................... 73 3.13 - Divises verticais da face. .................................................................................... 75 3.14 - Proporo 1:1 da distncia vertical do subnasal margem cutnea do vermelho do lbio inferior e deste ao tecido mole do mento .............................................. 76 4.1 - Tratamento de imagens buscando realar caractersticas de interesse. .................. 79 4.2 - Coleta da medida do primeiro tero da face. .......................................................... 81 4.3 - Coleta da medida do segundo tero da face. .......................................................... 81 4.4 - Coleta da medida do terceiro tero da face. ........................................................... 81 4.5 - Coleta da medida da largura do olho. ..................................................................... 82 4.6 - Coleta da medida da altura do olho. ....................................................................... 83 4.7 - Coleta da medida da largura do nariz. .................................................................... 83 4.8 - Coleta da medida da altura do nariz. ...................................................................... 84 4.9 - Coleta da medida da largura da boca. ..................................................................... 84 4.10 - Coleta da medida da altura da boca. ..................................................................... 85 4.11 - Coleta da medida da largura da face .................................................................... 85 4.12 - Coleta da medida da altura da face. ...................................................................... 85

4.13 - Medidas puras dos componentes e regies faciais do banco de imagens da Aominas. ........................................................................................................... 90 4.14 - Medidas puras dos componentes e regies faciais do banco de imagens de Yale. .. ................................................................................................................................ 90

4- 15 - Anlise de componentes e Regies da Face Banco de Imagens da Aominas. ...... ................................................................................................................................ 92 4.16 - Relaes entre componentes e Regies da Face. (Banco de Imagens da Aominas). .......................................................................................................... 93 4.17 - Esquema de funcionamento do sistema de reconhec imento facial. ..................... 96 4.18 - Relaes mtricas que mais variaram. ................................................................. 97 4.19 - Relaes mtricas que menos variaram. ............................................................... 98 5.1 - Curva de aprendizado usando relaes mtricas do Grupo1. ............................... 105 5.2 - Curva de aprendizado usando relaes mtricas do Grupo2. ............................... 107 5.3 - Curva de aprendizagem das mtricas do Grupo5. ................................................ 111 5.4 - Curva de aprendizagem para padres com baixa interferncia de cabelo, cavanhaque e barba (Grupo5.1). ...................................................................... 117 5.5 - Curva de aprendizagem das mtricas do Grupo5.2. ............................................. 121 5.6 - Curva de aprendizagem das mtricas do Grupo5.3. ............................................ 126 5.7 - Curva de aprendizagem dos 8 padres da Classe 3. ............................................. 129 5.8 - Dificuldades de determinao do primeiro tero da face. ................................... 135 5.9 - Dificuldade de localizao da regio mentoniana, usada na determinao da altura da face e do 3 tero facial. .................................................................................. 136

A1 Iniciando novo projeto de rede neural..................................................................157 A.2 Projeto XOR com as respectivas janelas de configurao...................................158 A.3 Contedo do arquivo XOR.cf..............................................................................159 A.4 Contedo do arquivo XOR.data..........................................................................160 A.5 Contedo do arquivo XOR.data..........................................................................161 A.6 Arquitetura da rede criada...................................................................................162 A.7 Janela de parmetros de treinamento da rede......................................................162 A.8 Grfico de evoluo do erro mdio quadrtico....................................................163

LISTA DE TABELAS Pg. 4-1 - Classificao facial segundo o ndice facial apresentado..................................... 86 4-2 - Mtricas das 22 faces do corpo de funcionrios da aominas s.a ........................ 88 4-3 - Mtricas das 15 faces do banco de faces da universidade de yale. ....................... 89 4-4a - Relaes normalizadas dos 22 funcionrios da aominas s.a. ............................ 94 4-4b - Relaes normalizadas da 15 faces da universidade de yale. ............................. 95 5-1 - Distribuio das faces dentro das 5 classes. ....................................................... 102 5-2 - Relaes mtricas usadas para representar as faces. ......................................... 103 5-3 - Grupos de relaes mtricas usados no treinamento. ......................................... 104 5-4 - Resposta da rede aos padres usados no treinamento (usando o grupo1) ......... 106 5-5 - Resposta da rede a padres totalmente desconhecidos (usando o grupo1) ........ 106 5-6 - Comparao entre o acrscimo de 1 relao especfica no vetor de identificao (grupo2 x grupo3 x grupo4). ............................................................................... 108 5-7 - Resposta da rede aos padres usados no treinamento (usando o grupo5) ......... 112 5-8 - Resposta da rede a padres totalmente desconhecidos (usando o grupo5) ........ 113 5-9 - Resposta da rede a padres conhecidos acrescidos de rudo (usando o grupo5)115 5-10 - Resposta da rede aos padres usados no treinamento (usando o grupo5.1) .... 118 5-11 - Resposta da rede a padres totalmente desconhecidos (usando o grupo5.1). .. 119 5-12 - Resposta da rede a padres conhecidos acrescidos de rudo (usando o grupo5.1). ...................................................................................................................................... 120 5-13 - Resposta da rede aos padres usados no treinamento (usando o grupo5.2) .... 122 5-14 - Resposta da rede a padres totalmente desconhecidos (usando o grupo5.2). .. 122 5-15 - Resposta da rede a padres conhecidos acrescidos de rudo (usando o grupo5.2). ...................................................................................................................................... 124 5-16 - ndice de acerto dos grupos em presena de rudos. ......................................... 127 5-17 - ndice de acerto dos 8 grupos para 15 padres desconhecidos, no presentes no treinamento....................................................................................................... 127 5-18 - Relaes mtricas que compem os padres de emtrada da rede da etapa2.... 129 5-19 - Resposta da rede aos padres usados no treinamento da classe 3. .................. 130

5-20 - Resposta da rede a padres conhecidos acrescidos de rudo (etapa 2 de reconhecimento). .............................................................................................. 131 5-21 - Resultados obtidos para as outras 4 classes (etapa 2 de reconhecimento)....... 132

CAPTULO 1 INTRODUO

O reconhecimento de faces uma das aes mais corriqueiras no dia a dia de um ser vivo inteligente. Esta atividade executada com tanta naturalidade por organismos vivos, tem despertado o interesse de pesquisadores que trabalham com Viso Computacional e Inteligncia Artificial. O intuito desses pesquisadores construir sistemas artificiais que sejam aptos a realizar o reconhecimento de faces humanas a fim de empregar esta capacidade nas mais diversas atividades, como por exemplo: sistemas de vigilncia, controles de acesso, definies automticas de perfis, entre outras. Pesquisas tambm vm sendo desenvolvidas por cientistas da computao no campo de reconhecimento de expresses faciais, para o emprego em interfaces homem x mquina. Sistemas capazes de interpretar expresses de raiva, tristeza ou alegria de seus usurios teriam grande aplicabilidade nos estudos de interao Homem x Computador (Tian et al., 2001). Devido grande variedade existente de rostos humanos muito difcil realizar um casamento perfeito de padres para o efetivo reconhecimento de um rosto, seguindo a metodologia clssica usada em reconhecimento de padres. Dificuldades como as transformaes a que um rosto pode estar sujeito, (culos, maquiagem, barba, bigode, etc.) interferem na confiabilidade das respostas dadas. A soluo (Manjunath et al., 1992) para o problema de reconhecimento de rostos pode englobar desde uma correlao simples de um modelo facial versus o rosto em questo, at sofisticados sistemas baseados em caractersticas. A fim de solucionar esses problemas, o processo de Viso Computacional se divide em etapas distintas, conforme ilustrado nas figuras 1.1 e 1.2 (Marr, 1982).

21

Aquisio

Pr-processamento Imagem Imagem

Segmentao Objeto

FIGURA 1.1 - Etapas iniciais do processo de Viso Computacional, obtendo como resultado parcial uma imagem contendo o objeto de interesse do sistema. FONTE: Oliveira (1997), p. 1. No esquema mostrado na Figura 1.1, a aquisio da imagem pode ser feita usando-se um scanner ou uma cmera. A imagem adquirida pode ser submetida a um pr-processamento, atravs de tcnicas de Processamento Digital de Imagens, (Fu et al., 1987) (Gonzalez e Wintz, 1992) com a finalidade de filtrar rudos, ajustar nveis de iluminao, entre outros detalhes. A etapa de segmentao visa localizar os objetos e pontos relevantes presentes na imagem, selecionando-se estas regies de interesse. A partir da aquisio destas regies, passa-se a trabalhar de forma comum aos problemas clssicos de reconhecimento de padres, como mostra a Figura1.2. Descrio Objeto Padro FIGURA 1.2 - Etapas finais do processo de Viso Computacional. FONTE: Oliveira (1997), p. 2. Aps a etapa de segmentao tem-se a imagem do objeto, necessitando-se ento da determinao dos critrios para sua descrio de forma representativa. preciso definir quais as mtricas e as relaes entre elas, para que seja possvel identificar o objeto. Finda a etapa de descrio, o objeto codificado em um vetor numrico denominado de padro ou vetor de caractersticas. Estes padres, representando o objeto em questo, so Reconhecimento Resposta

22

analisados um a um por um algoritmo de reconhecimento, que os separar em grupos seguindo um determinado critrio especial, definido na fase de descrio. A ltima etapa do processo responde se o objeto em questo um rosto humano por exemplo foi reconhecido ou no pelo sistema, e ainda qual a sua classificao em relao aos objetos de mesma natureza. 1.1. A Deteco de Faces Segundo (Sung et al., 1994), o reconhecimento de faces est diretamente relacionado deteco de tais objetos dentro das imagens apresentadas como entrada de um sistema reconhecedor. Uma primeira etapa para um reconhecedor automtico de faces portanto a deteco da presena de um rosto na imagem e, a partir da, a comparao de tal rosto com os modelos conhecidos pelo sistema. Do ponto de vista acadmico, a deteco de rostos interessante devido ao desafio representado por essa classe de objetos naturalmente estruturados, mas ligeiramente deformveis. H muitas outras classes de objetos e fenmenos no mundo real que compartilham de caractersticas similares s do rosto, como por exemplo as diferentes grafias manuais e impressas da letra A, anomalias de um tumor em uma imagem MRI (Interpretao por Ressonncia Magntica) e defeitos de materiais em uma linha de produo industrial. Portanto, avanos obtidos em estudos de deteco de rostos podem ser aplicados em outras atividades afins. Segundo (Ben-Yacoub et al., 1999) a confiabilidade e o tempo de resposta de um sistema de deteco de rostos influencia diretamente no desempenho e emprego desse sistema. Pode-se definir a deteco de rostos, de acordo com (Sung et al., 1994), como a determinao da existncia ou no de um rosto na imagem e uma vez encontrado este

23

objeto, sua localizao deve ser apontada atravs de um enquadramento ou retornando as suas coordenadas dentro da imagem. Sung et al. (1994) afirma ainda que a deteco de rostos dificultada por trs principais razes enumeradas a seguir. A primeira dessas razes afirma que embora a maioria dos rostos apresente estruturas semelhantes, com as mesmas caractersticas faciais bsicas (olhos, boca, nariz, sobrancelhas, etc) e dispostas aproximadamente nas mesmas configuraes de espao, pode haver um grande nmero de componentes no rgidos e texturas diferentes entre as faces. Estes elementos de variabilidade so resultantes das diferenas bsicas entre os rostos humanos pessoas podem apresentar o nariz mais adunco que outras, lbios mais ou menos carnudos, olhos mais ou menos puxados etc. Outros fatores relevantes so as flexibilizaes causadas no rosto pelas expresses faciais. O segundo ponto que dificulta a deteco de faces est relacionado com a presena de adornos, como culos ou bigodes, os quais podem estar presentes ou totalmente ausentes em uma face. Estes adornos podem, quando presentes, ocultar caractersticas faciais bsicas importantes deteco do rosto atravs do surgimento de sombras ou reflexos. A terceira dificuldade na deteco de faces a no previsibilidade das condies da imagem em ambientes sem restries de iluminao, cores e objetos de fundo. Devido ao fato das faces apresentarem estruturas tridimensionais, a mudana na distribuio de fontes de luz pode criar ou esconder sombras na face, resultando em uma variabilidade maior que as manipulveis em imagens bidimensionais. Para tratar os problemas relacionados s dificuldades de deteco de faces, basicamente existem trs abordagens principais: (1) o uso da correlao das imagens capturadas com modelos pr-existentes, (2) modelos deformveis e (3) imagens espaciais invariantes.

24

Na correlao entre imagens e modelos fixos trabalha-se com o casamento de filtros (matched filters). Nessa abordagem, registra-se a diferena medida entre um modelo padro fixo e a parte avaliada da imagem candidata naquele instante. O resultado da convoluo a diferena entre o fragmento avaliado e o padro. Quanto menor essa diferena, maior a probabilidade da imagem candidata corresponder ao padro procurado. A suposio adotada por essa abordagem de que o grau de elementos no rgidos de subcaractersticas da face (olhos, nariz, boca entre outros) seja pequeno o suficiente, a ponto de ser descrito de forma adequada por poucos modelos fixos. Num estgio posterior, a tcnica infere a presena de faces analisando as inter-relaes entre as sub-caractersticas encontradas. A abordagem de modelos deformveis similar, em princpio, abordagem clssica de correlao de modelos, exceto pelo fato de se comparar formas com componentes norgidos. Esta abordagem (Yuille et al., 1992) faz uso de curvas e superfcies parametrizadas para modelar os elementos no rgidos da face alm de sub-caractersticas como olhos, nariz e lbios. De acordo com (Sung et al., 1994) as curvas parametrizadas e superfcies so fixadas elasticamente em um modelo global, permitindo uma menor variao posicional entre as caractersticas faciais. O processo de combinao tenta alinhar o modelo com uma ou mais partes da imagem pr-processada, como por exemplo os picos, vales ou bordas. As premissas adotadas pela abordagem de imagens invariantes assumem que embora as faces possam apresentar grandes variaes na aparncia, devido a diferentes razes, h algumas relaes espaciais comuns nestas imagens, possivelmente nicas para todos os padres de face. Um esquema baseado nesta abordagem observa um conjunto de brilhos invariantes existentes entre as diferentes partes da face (Sinha, , 1994). Tambm nota-se que enquanto a iluminao e outras mudanas podem alterar significativamente o nvel de brilho em diferentes partes da face, a estrutura ordinal local de distribuio de brilho permanece praticamente sem modificaes. Por exemplo, a regio dos olhos de uma face

25

est quase sempre mais escura que a regio das bochechas e da testa, exceto sob certas condies particulares de iluminao. Para a localizao de uma face usando essa abordagem so avaliadas as partes claras e escuras do modelo em comparao com a imagem candidata. Se todos os pares de regies claras e escuras entre os objetos comparados, bem como suas inter-relaes coincidirem, caracteriza-se ento a presena de um rosto na imagem. Esta dissertao de mestrado ir partir da premissa que h uma face na imagem estudada e esta face est em posio bem definida dentro da imagem, evitando-se assim a etapa de deteco. Entretanto, muitos dos conceitos e tcnicas usadas para a deteco de uma face dentro de uma imagem sero de grande importncia para este trabalho, como ser visto mais frente. Para maiores detalhes sobre metodologias e abordagens para a deteco de rostos em imagens seguem as referncias (Lien et al., 2000), (Ben-Yacoub et al., 1999), (Han et al., 1997), (Rowley et al., 1995), (Sung et al., 1994). 1.2. O Reconhecimento de Faces O reconhecimento de faces uma particularizao (Oliveira, 1997) do problema geral de reconhecimento de padres. Portanto, pode ser ilustrado por um diagrama como o mostrado na Figura 1.3. Descrio Face Padro Reconhecimento Reconhecimento Identificao Categorizao Resposta FIGURA 1.3 - Etapas do problema de reconhecimento automtico de faces. FONTE: Oliveira (1997).

26

Em geral a entrada do mdulo de descrio uma imagem de face na escala esperada, tendo seus tons de cinza normalizados de acordo com um intervalo definido. Deste modo, tem-se uma imagem de face contida em uma matriz de dimenses m x n, contendo os valores de tons de cinza em cada pixel. Usando essa representao da face, forma-se um vetor v de comprimento L definido como sendo L = mn. Tal vetor v contm os valores dos pixels da imagem. Uma coleo de faces, onde cada uma delas representada por meio de um vetor, formar o conjunto de faces que dever ser reconhecido pelo sistema. A esse conjunto, d-se o nome de conjunto de treinamento, sendo aqui representado por T . Dessa forma, para se identificar N faces diferentes, o conjunto T de vetores v deve ser o seguinte: T = {v1 , v2 , v3 ,..., vN } (1.1)

O sistema de reconhecimento dever passar por uma etapa de treinamento, usando o conjunto T . Um outro conjunto 'T deve ser definido, contendo representaes de faces conhecidas e desconhecidas para o sistema. Tal conjunto ser usado na etapa de validao do sistema de reconhecimento, que responder sobre as novas faces apresentadas.
' ' 'T = v1, v1' , v2 , v2 , v3 , v3..., vN

(1.2)

O tipo de resposta esperada do sistema de reconhecimento pode variar de acordo com a aplicao. Pode-se verificar se a pessoa, cuja face v 1 se encontra no conjuto 'T ,

reconhecida pelo sistema (Oliveira, 1997). Pode-se listar dentro das imagens pertencentes ao conjunto de treinamento as que mais se assemelham com a imagem apresentada. possvel ainda retornar o nome associado face representada pelo vetor v1 , indicar o seu sexo, sua raa ou expresso facial.

27

Portanto, segundo (Oliveira, 1997) pode-se dividir as possveis respostas do sistema de reconhecimento automtico em trs tipos: o reconhecimento propriamente dito, a identificao e a categorizao de faces. O reconhecimento consiste em confirmar se uma imagem de face conhecida pelo sistema. No necessrio realizar a ligao da face a um nome e sim atribuir- lhe uma classificao: conhecida ou desconhecida. A identificao deve realizar o reconhecimento e associar uma identidade face apresentada. J a categorizao, compreende as tarefas de identificao de sexo, raa ou estado emocional da imagem apresentada. Ela pode tambm ser aplicada na definio de qual o tipo facial a face se encaixa, segundo um padro de esttica adotado. Nesta dissertao de mestrado sero abordadas as atividades de reconhecimento e identificao de faces, como est descrito nos captulos 4 e 5. O prximo tpico trata de uma das metodologias aplicadas ao reconhecimento facial usadas nesta dissertao. 1.3. Mtodos Geomtricos para Reconhecimento Facial A primeira tentativa reportada de automatizao do reconhecimento de faces, conforme (Oliveira, 1997), foi realizado por W. Bledsoe na dcada de 60. Inicialmente, em (Chan e Bledsoe, 1965) e mais tarde em (Bledsoe, 1966), onde descrito um sistema semiautomtico de reconhecimento de faces. Bledsoe usou marcaes feitas mo em fotografias indicando cantos dos olhos, boca e queixo. Aps a extrao dessas caractersticas o vetor de medidas era submetido a um algoritmo de classificao numrica. Um dos objetivos deste trabalho substituir o uso desse algoritmo de classificao numrica por uma ferramenta inteligente, aqui representada pelas redes neurais. O uso de

28

mtodos inteligentes visa tornar o sistema de reconhecimento capaz de absorver pequenas variaes ocorridas no momento da coleta de medidas faciais. Espera-se portanto que o sistema aqui proposto seja mais robusto a falhas e responda de forma mais confivel, pois estaro sendo combinadas as vantagens dos mtodos geomtricos (robustez a variao de iluminao e escala por exemplo) e as caractersticas das redes neurais (no linearidade, mapeamento de entrada e sada, adaptabilidade, tolerncia a falhas, capacidade de generalizao, entre outras). Uma tentativa de padronizar as caractersticas que deveriam ser extradas de uma imagem de face para seu reconhecimento, foi realizada por uma equipe dos Laboratrios Bell e apresentada em (Goldstein et al., 1971). Porm, o vetor de caractersticas definido por eles para identificar uma face era baseado em parmetros como por exemplo tamanho dos lbios e das orelhas, alm de outras caractersticas no geomtricas e bastante subjetivas como a tonalidade do cabelo. Ainda na dcada de 70, (Kanade, 1973) automatizou completamente a etapa de descrio facial. Usando um robusto detector de caractersticas (construdo a partir de mdulos simples usados dentro de uma estratgia backtracking), um vetor de 16 caractersticas geomtricas foi extrado de uma imagem de face binarizada. Anlises de variaes dentro de uma mesma classe e entre classes diferentes de informaes revelaram que alguns parmetros eram menos eficientes que outros, reduzindo assim a dimensionalidade do vetor. Tal mtodo chegou a atingir 75% de acerto no reconhecimento facial em uma base de dados formada por 20 faces diferentes. Foram usadas duas imagens por pessoa, sendo a primeira imagem a referncia inicial e a segunda usada para teste. J na dcada de 90, o trabalho de (Kanade, 1973) foi revisto por (Brunelli e Poggio, 1991). Brunelli e Poggio (1991) usaram o trabalho de Kanade como base para suas pesquisas. Os procedimentos computacionais usados por eles no seguiram todo o rigor do trabalho de Kanade, mas a base de dados usada por Brunelli e Poggio foi mais abrangente em termos de diversidade de faces, pois o banco de faces era composto por 47 pessoas.

29

Foram usadas quatro instncias para representar cada pessoa. As caractersticas usadas para representar a face levavam em conta a simetria existente na face humana. O vetor era composto por 35 medidas referentes aos olhos, sobrancelhas, nariz, boca, queixo e formato da face. Os diferentes mtodos geomtricos chegaram a atingir taxas de acerto de 90% para um conjunto fixo e no muito grande de faces, segundo o levantamento realizado por (Oliveira, 1997). Entretanto, em muitos casos no era avaliada a capacidade do sistema de identificar imagens ainda no vistas de faces conhecidas, pois as imagens empregadas na avaliao do sistema eram as mesmas utilizadas na etapa de construo. Os trabalhos do grupo de Vicki Bruce (Bruce et al., 1993), (Burton et al., 1993) e (Bruce e Humphreys, 1994) tratam dos fundamentos psicolgicos de utilizar uma abordagem geomtrica para o reconhecimento facial. Aps rever a literatura sobre reconhecimento de objetos e de faces, Bruce sugere diferenas bsicas entre o processo humano de reconhecimento de faces e o reconhecimento de objetos em geral. Afirma-se que a identificao de objetos baseada em suas partes e fortemente fundamentada na anlise de arestas, enquanto o reconhecimento de faces parece ser resultado de uma anlise mais global das formas e fundamentado em informaes de textura (Bruce e Humphreys, 1994). A partir de experincias, afirma-se em Bruce e Humphreys(1994) que as codificaes feitas pelo ser humano, relativa s a objetos e faces, so processadas em reas diferentes e de maneiras diferentes no crtex cerebral. Estas descobertas levaram s abordagens baseadas em caractersticas que trabalham com estruturas existentes no crtex visual. A abordagem baseada em caractersticas pode fazer uso de "Wavelets" , em especial as "Wavelets de Gabor para a extrao dessas caractersticas e ainda usa uma arquitetura de grafos (grafos topolgicos, grafos elsticos, etc) para a representao da face, como pode ser visto em (Manjunath, 1992), (Wiskott et al., 1996) dentro de aplicaes voltadas para o reconhecimento de faces e em (Lyons et al, 1998), (Lyons et al, 2000) no reconhecimento de expresses faciais.

30

Esta dissertao tambm tem por objetivo principal explorar as mtricas faciais tomando por base os estudos anatmicos relacionados com a odontologia, reconstituio maxilofacial e fonoaudiologia, visando o reconhecimento de faces humanas. Os trabalhos estudados at ento para a confeco desta dissertao apresentam medidas caractersticas da face, tomadas a partir de pontos faciais muitas vezes subjetivos, no havendo uma padronizao de quais so realmente as medidas relevantes para o discernimento de rostos. No se estabelece tambm ligaes de tais medidas com sexo e raa do modelo. Procura-se tambm neste trabalho, analisar a viabilidade de uma abordagemque faa uso de uma metodologia antiga, como o caso dos mtodos geomtricos, combinado a novas tendncias como as redes neurais artificiais. 1.4. Objetivos desta Dissertao Conforme j mencionado no sub-tpico 1.1, esta dissertao ir partir da premissa que h uma face na imagem estudada e esta face est em posio bem definida dentro da imagem, evitando-se assim a etapa de deteco. O objetivo principal desta dissertao demonstrar a viabilidade de um sistema de reconhecimento facial, usando uma rede neural multicamadas, tendo como entrada um vetor composto pelas relaes mtricas entre componentes e regies da face. Tais relaes mtricas so obtidas com base no estudo da anatomia facial, usando as mesmas referncias e pontos chaves utilizados em ortodontia, fonoaudiologia e reconstituio maxilo- facial. Os alvos de estudo deste trabalho podem ser listados como se segue:

Verificar as dificuldades existentes na extrao de caractersticas faciais


relevantes tarefa de reconhecimento, buscando-se uma forma de orientar ou alertar para a escolha correta das mtricas mais aptas para esta tarefa.

31

Explorar as mtricas faciais tomando por base os estudos anatmicos relacionados


com a odontologia e fonoaudiologia, visando o reconhecimento de faces humanas.

Verificar a viabilidade de substituir, em um sistema de reconhecimento facial, o


uso de algoritmos de classificao numrica por uma ferramenta inteligente, aqui representada pelas redes neurais, buscando um sistema mais robusto a variaes causadas por expresses faciais diferentes ou mesmo causadas por rudos durante a etapa de coleta de dados.

Analisar a viabilidade de uma abordagem que mescle uma metodologia antiga,


como os mtodos geomtricos, a novas tendncias como as redes neurais artificiais. 1.5. Aplicaes Embora o reconhecimento de rostos familiares, ou a identificao de semelhanas entre fisionomias faciais, seja uma tarefa realizada pelos seres vivos inteligentes com certa tranqilidade e exatido, o processo para a realizao dessa tarefa ainda no completamente compreendido. Estudos foram realizados descobrindo-se que partes do crebro so usadas no reconhecimento de faces. Porm, tais estudos no respondem como essas faces so

representadas internamente dentro de um crebro. No respondem tambm a questes relativas a que partes da face so essenciais para o seu reconhecimento; qual o motivo para haver tanta confuso por parte dos ocidentais em diferenciar faces de orientais; que caractersticas e padres exatos atribuem uma esttica agradvel a um rosto. Apenas responder a estes questionamentos j seria uma boa aplicao para um estudo sobre faces humanas e reconhecimento facial. Porm, h outros motivos para se realizar pesquisas sobre o reconhecimento de faces e sobre as caractersticas relacionadas ao rosto humano.

32

O uso de sistemas de reconhecimento facial aplicado ao controle de acessos, ou na busca de pessoas suspeitas em um grupo, de grande aplicabilidade por se tratar de uma forma menos invasiva, comparando-se a mtodos como o scan de retina ou verificao de impresses digitais. Mesmo que tais sistemas de reconhecimento baseados em faces no sejam absolutamente infalveis, at o momento, sempre possvel solicitar o auxlio humano para validar a deciso ou classificao no reconhecimento de um rosto. Tal situao seria invivel para um exame de retina. A iterao homem X mquina tambm seria privilegiada por sistemas que reconhecessem faces. Poder-se-ia definir perfis de usurios apenas identificando sua face. Atitudes diferentes poderiam ser tomadas para determinados usurios, tendo em vista uma estimativa de sua idade, expresso facial de raiva ou dor, ou ainda sabendo seu sexo. A seguir ser descrito como est organizada esta dissertao. 1.6. Organizao Esta dissertao est dividida em 6 partes, da seguinte forma. O Captulo 2 apresenta uma explanao sobre redes neurais e sobre seu uso na tarefa de reconhecimento facial. mostrada uma implementao realizada por (Oliveira, 1994) usando redes neurais artificiais no lineares, com extrao implcita de caractersticas teis ao reconhecimento facial. No Captulo 3 introduz-se os conceitos de morfologia facial, usados para a determinao dos pontos cha ves localizados na face. Tais referncias so empregadas na criao dos vetores caratersticos de cada face. Neste captulo so mostrados em detalhes a arquitetura ssea da face, caractersticas referentes a pontos especficos do esqueleto facial, interferncia do esqueleto facial com a forma apresentada pelo rosto, alm da forma de obteno das mtricas usadas neste trabalho.

33

O Captulo 4 descreve a metodologia utilizada para a extrao das caractersticas da face, as mtricas obtidas atravs desta metodologia, bem como a estrutura e funcionamento interligado das redes neurais usadas para o reconhecimento facial. No Captulo 5 so apresentados os resultados e a metodologia usada nos testes, incluindo os parmetros da rede e rudos inseridos nos padres de entrada para a realizao dos testes. Finalmente, so apresentadas as concluses e perspectivas para trabalhos futuros.

34

CAPTULO 2 MTODOS CONEXIONISTAS NO LINEARES

As expresses faciais so os mais poderosos, naturais e imediatos meios para os seres humanos comunicarem suas emoes e intenes. Freqentemente as emoes so expressas pela face antes mesmo de serem verbalizadas (Tian et al, 2001). Muitos trabalho (Lien et al., 2000), (Tian et al., 2000a), (Bartlett et al., 1999), (Cohn et al., 1999), (Donato et al., 1999), (Fukui e Yamaguchi, 1998), (Black e Yacoob, 1995), tm sido desenvolvidos buscando construir sistemas computacionais capazes de compreender e usar esta forma natural de comunicao. Embora as expresses faciais sejam teis e de grande interesse para a rea de interao homem x mquina, sob o ponto de vista do reconhecimento facial, elas formam um grande obstculo. Juntamente com as variaes de iluminao, posio da face, escala, tamanho e orientao da cabea, as expresses faciais torna m extremamente complexa a tarefa do reconhecimento facial. Graas a estas particularidades, uma mesma face pode ser considerada completamente diferente para um sistema automtico de reconhecimento. Como uma tentativa de contornar, ou pelo menos minimizar, estas influncias so usadas neste trabalho as redes neurais artificiais, buscando usar sua capacidade de generalizao, dentre outras habilidades, para efetuar um reconhecimento facial eficiente. O presente Captulo faz uma descrio sobre os mtodos cone xionistas, especificamente sobre redes neurais artificiais, descrevendo seus componentes, exemplificando possveis arquiteturas e tambm descrevendo o funcionamento de uma rede multicamadas. Tambm descrita aqui uma implementao realizada por (Oliveira, 1994) de um reconhecedor neural de faces.

35

2.1. Redes Neurais Artificiais (Oliveira, 1997) afirma que a partir da dcada de 80, os modelos conexionistas passaram a ser uma ferramenta comum para a soluo de problemas em diversos campos, sendo principalmente representados pelas redes neurais artificiais no- lineares. Este sub-tpico apresentar a descrio bsica do funcionamento de uma rede neural, mostrando vantagens e desvantagens do uso de mtodos generalistas. Apresentar tambm um modelo neural usado por (Oliveira, 1994) na soluo do problema de reconhecimento automtico de faces. 2.1.1. Introduo As Redes Neurais Artificiais representam uma tecnologia que possui razes em muitas disciplinas: neurocincia, matemtica, estatstica, fsica, cincia da computao e engenharia. (Haykin, 20011) Uma rede neural artificial um modelo computacional capaz de, entre outras funes, armazenar, classificar padres, realizar interpolao de funes no- lineares e apresentar solues heursticas para problemas de otimizao. Isso conseguido atravs de um processo denominado aprendizado. O aprendizado pode ser representado pela Figura 2.1, onde o ambiente fornece alguma informao para um elemento de aprendizagem. Elemento de aprendizagem Base de conhecimento Elemento de desempenho

Ambiente

FIGURA 2.1 Modelo simples de aprendizagem de mquina. FONTE: Haykin (2001), p. 61.

36

O elemento de aprendizagem utiliza, ento, esta informao para aperfeioar a base de conhecimento, e finalmente o elemento de desempenho utiliza a base de conhecimento para executar a sua tarefa. Normalmente, a informao que o ambiente fornece para a mquina imperfeita, resultando que o elemento de desempenho no sabe previamente como preencher os detalhes ausentes ou ignorar os detalhes que no so importantes. Portanto, a mquina opera inicialmente por suposio e depois recebe alimentao do elemento de desempenho. O mecanismo de realimentao permite que a mquina avalie suas hipteses e as revise, se necessrio (Haykin, 2001). A aprendizagem de mquina envolve dois tipos bastante diferentes de processamento de informao: o indutivo e o dedutivo. No processamento de informao indutivo, padres gerais e regras so determinados a partir dos dados brutos e da experincia. Por outro lado, no processamento de informao dedutivo so utilizadas regras gerais para determinar fatos especficos. A aprendizagem baseada em similaridade utiliza induo, enquanto que a prova de um teorema uma deduo baseada em axiomas conhecidos e em outros teoremas existentes. A aprendizagem baseada em explanao utiliza tanto a induo quanto a deduo (Haykin, 2001). 2.1.2. Definies A operao realizada por uma rede neural feita atravs de uma associao de elementos de processamento e conexes. O elemento bsico de um processamento de uma rede neural chamado de neurnio, ou nodo. A Figura 2.2 (Haykin, 2001) mostra o diagrama bsico do funcionamento de um neurnio artificial.

37

Bias bk x1 Sinais de entrada x2 . . . xm Funo de ativao

Wk1 Wk2 . . . Wkm Pesos sinpticos

Juno aditiva

(.)

Sada yk

FIGURA 2.2 - Modelo no linear de um neurnio artificial. FONTE: Adaptado de Haykin (2001), p. 36. Um neurnio uma unidade de processamento de informao que fundamental para a operao de uma rede neural. Na Figura 2.2 pode-se identificar trs elementos bsicos do modelo neuronal (Haykin, 2001): 1) Um conjunto de sinapses ou elos de conexo, cada uma caracterizada por um peso ou fora prpria. Especificamente, um sinal x j na entrada da sinapse j conectada ao neurnio k multiplicado pelo peso sinptico Wkj. importante notar a maneira como so escritos os ndices do peso sinptico Wkj. O primeiro ndice se refere ao neurnio em questo e o segundo se refere ao terminal de entrada da sinapse qual o peso se refere. Ao contrrio de uma sinapse do crebro, o peso sinptico de um neurnio artificial pode estar em um intervalo que inclui valores negativos bem como positivos (Haykin, 2001).

38

2) Um somador para somar os sinais de entrada, ponderados pelas respectivas sinapses do neurnio; as operaes descritas aqui constituem um combinador linear (Haykin, 2001). 3) Uma funo de ativao para restringir a amplitude da sada de um neurnio. A funo de ativao tambm referida como funo restritiva j que restringe (limita) o intervalo permissvel de amplitude do sinal de sada a um valor finito. Tipicamente, o intervalo normalizado da amplitude da sada de um neurnio escrito como o intervalo unitrio fechado [0, 1] ou alternativamente [-1, 1] (Haykin, 2001). O modelo neural da Figura 2.2 tambm inclui um bias aplicado externamente, representado por bk. O bias bk tem o efeito de aumentar ou diminuir a entrada lquida da funo de ativao, dependendo se ele positivo ou negativo, respectivamente. Em termos matemticos, podemos descrever um neurnio k escrevendo o seguinte par de equaes:

u k = j =1 wk j x j
m

(2.1)

y k = (u k + bk )

(2.2)

onde x 1 , x2 , ..., xm so os sinais de entrada; wk1, wk2, ..., wkm so os pesos sinpticos do neurnio k; uk a sada do combinador linear devido aos sinais de entrada; bk o bias;

() a funo de ativao; e yk o sinal de sada do neurnio. O uso do bias bk tem o efeito .


de aplicar uma transformao afim sada uk do combinador linear no modelo da Figura 2.2, como mostrado por:

39

vk = uk + bk

(2.3)

O sinal de entrada de um dado neurnio vem de um outro nodo da rede ou de fontes externas. Esse sinal viaja atravs das conexes que alimentam os neurnios. Estes neurnios (Oliveira, 1997) trabalham em paralelo, podendo ser configurados sob a forma de diferentes arquiteturas. Os neurnios esto quase sempre dispostos em camadas ou nveis, e a fora de cada uma das conexes que os interliga expressa por um valor numrico chamado peso. O conhecimento adquirido pela rede a partir do seu ambiente, atravs de um processo de aprendizagem (Haykin, 20011). O processo de aprendizagem nada mais do que o ajuste dos pesos sinpticos da rede, de forma ordenada durante a etapa de treinamento, at que a rede esteja devidamente treinada. O nmero de nodos e nveis da rede, alm do modo como estes elementos esto dispostos e conectados, determinam a topologia da rede neural. A definio da topologia de rede a ser adotada deve estar diretamente ligada natureza do problema a ser resolvido. H vrias topologias de redes, cada qual com suas particularidades e aplicaes. Alguns tipos destas topologias so mostrados na Figura 2.3.

40

FIGURA 2.3 Exemplo de topologias bsicas de redes neurais: (a) rede neural feedforward de 1 camada; (b) rede neural feedforward de vrias camadas; (c) nodo simples com retro-alimentao; (d) rede recorrente de camada simples; (e) rede recorrente de mltiplas camadas FONTE: adaptado de Lin, C.T. (1996), p. 211. Outro ponto a ser definido, em se tratando de redes neurais, o algoritmo a ser usado para corrigir os pesos das conexes sinpticas. A esse algoritmo d-se o nome de algoritmo de treinamento. Assim, a cada rede neural associada uma estrutura topolgica pr-definida alm de um conjunto de tcnicas usadas para o treinamento dessa rede. Na fase de treinamento, os pesos so ajustados de forma a fazer com que a rede aprenda uma dada tarefa. Alm das arquiteturas mostradas na Figura 2.2, podem ser citadas ainda as redes ANFIS (Adaptative-Network-based-Fuzzy-Inference), ART (Adaptative Resonance Theory), redes morfolgicas, entre outras. Maiores detalhes sobre arquiteturas e critrios de treinamento de redes neurais, alm de um histrico evolutivo, podem ser encontradas em (Carpenter e

41

Grossberg 1987a,b, 1988,1990), (Haykin, 20011), (Lin, (Hertz et al., 1991) e (Zurada, 1992). 2.2. Redes Multicamadas No-Lineares

e Lee, 1996), (Senna, 1996),

Pesquisadores com conhecimento em redes neurais artificiais no-lineares comearam a estudar a possibilidade de aplicao das redes multicamadas no- lineares no tratamento de faces (Oliveira, 1997). Em (Cottrell e Munro, 1988), afirma-se que assinalar imagens de faces com diferentes expresses da mesma pessoa um problema de separao no- linear. Haykin, 2001As redes multicamadas possuem caractersticas importantes como capacidade de classificao eficiente de padres, sendo tambm robustas a entradas ruidosas ou incompletas. Outra importante caracterstica deste tipo de rede sua boa generalizao, sendo capaz de realizar separaes no- lineares no conjunto de dados. Em Haykin (2001), diz-se que uma rede generaliza bem quando h um mapeamento de entrada-sada computado de forma correta (ou aproximadamente correta) para dados de teste no utilizados na criao ou treinamento da rede. O treinamento de uma rede multicamadas feito de forma supervisionada, geralmente por um algoritmo conhecido como algoritmo de retropropagao do erro (error backpropagation). Este algoritmo baseado na regra de aprendizagem por correo do erro. Ao receber uma entrada, a rede instruda sobre como deve responder, e a diferena entre a resposta desejada e a obtida repassada rede, servindo como regra de ajuste dos pesos. A estrutura de uma rede multicamadas lembra a de um grafo bipartido, dirigido e com pesos. As conexes ligam cada nodo de uma camada a todos os nodos da camada imediatamente superior a ele, podendo-se ainda deixar alguns nodos sem conexo caracterizando uma rede parcialmente conectada. As camadas so de trs tipos, como pode ser visto na Figura 2.3.

42

Camada de entrada

Camada de Sada.

Camada oculta. FIGURA 2.3 - Camadas de uma rede neural artificial multicamadas. Camada de entrada : recebe os dados de entrada. Os nodos nesta camada no realizam processamento local, pois apenas propagam os dados para os nodos da prxima camada. Existe apenas uma nica camada de entrada em uma rede multic amadas. Camada de sada : contm a resposta da rede. Aps a entrada ser propagada e processada, os valores de ativao dos nodos desta camada representam a resposta da rede. Assim como a camada de entrada, a camada de sada sempre nica. Camada oculta: so as camadas situadas entre as camadas de entrada e de sada. Podem existir vrias camadas ocultas. Em Haykin (2001), afirma-se que para determinados problemas, como aproximao de funes, til o uso de duas camadas ocultas. A primeira camada oculta se encarrega da extrao de caractersticas locais enquanto a segunda camada extrai as caractersticas globais. Dessa forma, usando-se duas camadas, o processo de aproximao (ajuste da curva) se torna mais gerencivel. Os tamanhos das camadas de entrada e sada so estabelecidos de acordo com as caractersticas do problema a ser tratado. J o nmero de nodos das camadas ocultas determinado por experincia, dependendo da complexidade do problema (Oliveira, 1997).

43

2.2.1.

O processo de aprendizado

A propriedade que de importncia primordial para uma rede neural a sua habilidade de aprender a partir de seu ambiente e de melhorar o seu desempenho atravs de aprendizagem. A melhoria do desempenho ocorre com o tempo de acordo com alguma medida preestabelecida. Uma rede neural aprende acerca do seu ambiente atravs de um processo interativo de ajustes aplicados a seus pesos sinpticos e nveis de bias. Idealmente, a rede se torna mais instruda sobre o seu ambiente aps cada iterao do processo de aprendizagem (Haykin, 2001). H atividades demais associadas noo de aprendizagem para justificar a sua definio de forma precisa (Haykin, 2001). Uma definio de aprendizagem segundo o contexto de redes neurais, adaptada de Mendel e McClarem (1970) feita a seguir: Aprendizagem um processo pelo qual os parmetros livres de uma rede neural so adaptados atravs de um processo de estimulao pelo ambiente no qual a rede est inserida. O tipo de aprendizagem determinado pela maneira pela qual a modificao dos parmetros ocorre. A definio do processo de aprendizagem implica nos seguintes eventos (Haykin, 2001): 1) A rede neural estimulada por um ambiente; 2) A rede neural sofre modificaes nos seus parmetros livres como resultado desta estimulao; 3) A rede neural responde de uma maneira nova ao ambiente, devido s modificaes ocorridas na sua estrutura interna. Um conjunto bem estabelecido de regras bem-definidas para a soluo de um problema de aprendizagem denominado um algoritmo de aprendizagem. No h um algoritmo nico para o projeto de redes neurais. Basicamente, os algoritmos de aprendizagem diferem entre si pela forma como definido o ajuste de um peso sinptico de um neurnio.

44

Em Haykin (2001) so descritas 5 regras de aprendizagem (aprendizado por correo de erro, aprendizagem baseada em memria, aprendizagem hebbiana, aprendizagem competitiva e aprendizagem de Boltzmann) bsicas para o projeto de redes neurais. Cada uma das regras citadas tem aplicao mais eficaz em uma determinada tarefa. Um outro fator a ser considerado a maneira pela qual uma rede neural, constituda de um conjunto de neurnios interligados, se relaciona com o seu ambiente. Haykin (2001) explica dois paradigmas de aprendizado: aprendizado supervisionado e aprendizado nosupervisionado. A escolha de um ou outro mtodo tem ligao direta natureza do problema que se deseja resolver. Em alguns casos (como heteroassociao, classificao de padres, reconhecimento de padres entre outros) usa-se o paradigma de aprendizagem supervisionada (ou aprendizagem com um professor). Conceitualmente pode-se considerar o professor como sendo um elemento com um conhecimento sobre o ambiente, sendo este conhecimento representado por um conjunto de exemplos de entrada-sada. Entretanto o ambiente desconhecido pela rede neural de interesse. Portanto, no primeiro passo o professor e a rede neural so expostos a um vetor de treinamento (i.e., exemplo) retirado do ambiente. Em virtude do conhecimento prvio apresentado pelo professor, ele capaz de fornecer rede uma resposta desejada para aquele vetor de treinamento. Na verdade, a resposta desejada representa a ao tima a ser realizada pela rede neural. Os parmetros da rede so ajustados sob a influncia combinada do vetor de treinamento e do sinal de erro. O sinal de erro definido como a diferena entre a resposta desejada e a resposta real da rede. Este ajuste realizado passo a passo, iterativamente, com o objetivo de fazer a rede neural emular o professor (Haykin, 2001). Desta forma, o conhecimento do ambiente disponvel ao professor transferido para a rede neural atravs de treinamento, da forma mais completa possvel. Quando esta condio alcanada, pode-se ento dispensar o professor e deixar a rede neural lidar com o ambiente inteiramente por si mesma.

45

J em outras situaes (extrao de caractersticas e autoassociao por exemplo) opta-se pelo uso do aprendizado no-supervisionado. Na aprendizagem no-supervisionada ou auto-organizada, no h um professor externo ou um crtico para supervisionar o processo de aprendizado. Em vez disso, so fornecidas condies para realizar uma medida independente da tarefa da qualidade de representao que a rede deve aprender, e os parmetros livres da rede so otimizados em relao a esta medida. Uma vez que a rede tenha se ajustado s regularidades estatsticas dos dados de entrada, ela desenvolve a habilidade de formar representaes internas para codificar as caractersticas da entrada e, desse modo, de criar automaticamente novas classes (Becker, 1991). Maiores detalhes sobre os tipos de aprendizado, paradigmas, aplicaes bem como comparativos de desempenho, podem ser encontrados em (Haykin, 2001), (Randall e Jatinder, 2000) e (Lin e Lee, 1996). Esta dissertao far uso do algoritmo de retropropagao do erro para realizar o treinamento das redes neurais multicamadas, empregadas no reconhecimento facial. Este algoritmo baseado na regra de aprendizagem por correo do erro. Basicamente, a aprendizagem por retropropagao do erro consiste de dois passos atravs das diferentes camadas da rede: um passo para frente, a propagao, e um passo para trs, a retropropagao. No passo para frente, um padro de atividade (vetor de entrada) aplicado aos ns sensoriais da rede e seu efeito se propaga atravs da mesma. Durante o passo de propagao, os pesos sinpticos da rede so todos fixos. Durante o passo para trs, por outro lado, os pesos sinpticos so todos ajustados de acordo com uma regra de correo de erro. Especificamente, a resposta real da rede subtrada de uma resposta desejada (alvo) para produzir um sinal de erro (Haykin, 2001). O objetivo do treinamento minimizar o erro mdio quadrtico entre a sada da rede e a resposta desejada (Zurada, 1992). Este sinal de erro ento propagado para trs atravs da rede, na direo oposta a das conexes sinpticas. Os pesos sinpticos so ajustados para fazer com que a resposta

46

real da rede se mova para mais perto da resposta desejada, em um sentido estatstico (Haykin, 2001). O processo de aprendizagem realizado com o algoritmo chamado de aprendizagem por retropropagao. O prximo tpico ilustra uma implementao possvel para um reconhecedor neural de faces usando uma rede multicamadas treinada por retropropagao. 2.3. Implementando um Reconhecedor Neural Uma imagem de face um vetor f i de P pixels, sendo que cada um destes pixels pode apresentar um valor de tom de cinza entre 0 e t . Assim, cada imagem pode ser considerada

r um vetor geomtrico f i , em um espao P-dimensional


imagens representveis com t tons de cinza.

P , que compreende todas as

tP

Como as faces so objetos semelhantes, com olhos, boca e nariz nas mesmas posies relativas, afirma-se que a distribuio espacial de tons de cinza das imagens de faces faz r com que os vetores f i estejam concentrados em um sub-espao muito menor que

r desta face deve implementar uma reduo na dimensionalidade dos vetores f i , para uma
distribuio mais concentrada e eficiente. Aps a fase de descrio, cada imagem codificada em um padro Pi de dimenses muito menores que as dimenses das imagens originais. Esses padres podem ento ser processados por um algoritmo de classificao ou agrupamento, que compreende a etapa de reconhecimento. Considerando-se ento uma rede multicamada no- linear que, de posse de uma imagem f i , consiga agir de maneira anloga a um compressor de dados. Isto pode ser feito treinando

P (Turk e Petland, 1991). Portanto, para se representar uma face, a fase de descrio

47

uma rede de trs nveis para repetir a imagem de entrada na camada de sada, passando por uma camada oculta com um nmero de nodos consideravelmente menor que o nmero de pixels da imagem. Se esta rede for capaz de reproduzir imagens de face com um desvio pequeno, as informaes contidas na camada oculta podem ser consideradas como uma representao reduzida da face. Esta estrutura para compactao foi implementada por (Oliveira, 1994) e obteve bons resultados comparados aos mtodos tradicionais (Oliveira, 1997). 2.3.1. Etapa de Descrio Uma rede como a mostrada na Figura 2.4 (Oliveira, 1997) treinada com o algoritmo de retropropagao do erro capaz de realizar a compactao citada, e pode ser usada para implementar a etapa de descrio do processo de reconhecimento de faces.

Imagem de entrada

Imagem de sada

FIGURA 2.4 - Topologia de rede multicamada para extrao de caractersticas. Apesar de no mostrado na figura para melhor visualizao, cada nodo totalmente conectado com os nodos da camada seguinte. FONTE: Oliveira (1997), p. 29.

48

Seja T um conjunto de faces usadas para o treinamento da rede. O conjunto T contm imagens de face f i de N pessoas diferentes, com i variando de 1 ao nmero total de pessoas: N. Para que os dados sejam tratados corretamente pela rede, preciso que os valores numricos em T sejam codificados de modo a no apresentarem uma ordem de grandeza muito diferente da encontrada nas funes de ativao e dos pesos da rede. Esta modelagem inicial um processo que depende da topologia e do tipo de treinamento escolhido para a rede, e no obedece a um procedimento especfico. No caso especfico da aplicao proposta por (Oliveira, 1994), os padres f i apresentam valores de tons de cinza entre 0 e t, onde t usualmente igual a 127 ou 255. Sugere-se que os valores de tons de cinza sejam mapeados de acordo com a imagem da funo de ativao utilizada, tornando os valores de ativao de todos os nodos da rede compreendidos em uma mesma faixa. A funo sigmoidal escolhida para a rede implementada em (Oliveira, 1994) mostrada na equao 2.4, e portanto os tons de cinza originais de 0 a 127 foram mapeados em valores entre 0 e 1. As imagens de face f i possuam dimenses de 64x64, portanto a rede de compresso tinha 4.096 nodos na camada de sada e de entrada. Aps vrios testes, a camada oculta foi fixada em 330 nodos. Os resultados obtidos na compresso podem se encontrados com detalhes em (Oliveira, 1994).

( v) =

1 1 + e (v )

(2.4)

49

2.3.2. Etapa de Reconhecimento A etapa de compactao das imagens de faces presentes no conjunto T , funciona como um extrator de caractersticas relevantes destas faces. Tais caractersticas ficaram codificadas nos pesos da rede. De posse desta rede treinada (Oliveira, 1997) para realizar compactao de imagens, ou seja, capaz de extrair as caractersticas aptas diferenciao entre as facesparte-se para a construo de uma rede para reconhecimento de padres. Assim, utiliza-se a informao codificada na camada oculta da rede de compresso como entrada para um classificador. Esse classificador uma rede no linear de trs camadas, assim como a utilizada para a extrao de caractersticas. Apesar disso, existem algumas mudanas na topologia:

Camada de entrada possui um nmero de nodos igual ao nmero utilizado na


camada oculta da rede de extrao de caractersticas.

A camada de sada possui N nodos i , onde i varia de 1 a N e onde N o nmero


de pessoas distintas de T .

A camada oculta deve possuir um nmero de nodos necessrio para a


convergncia do treinamento, sendo N-1 uma sugesto para o nmero inicial de nodos. A rede de reconhecimento recebe como entrada os valores de ativao dos nodos da camada oculta da rede de extrao de caractersticas, cujos pesos j se encontram fixos aps o treinamento. Treina-se ento a rede de reconhecimento atravs do algoritmo de retropropagao para realizar a classificao dos padres. Cada nodo de sada i assinalado a uma pessoa cuja imagem est em T . Assim, ao receber uma imagem de teste f i, um dos nodos de sada i deve responder com um valor de

50

ativao sensivelmente maior que os restantes. Quanto mais prximo de 1 for esse valor, maior a probabilidade de que a pessoa da imagem de teste f i seja a mesma representada na sada i , onde i o nodo com maior resposta. Aps o treinamento da rede de reconhecimento, pode-se construir uma rede nica para realizar a identificao das pessoas em T . Para isso, mantm-se fixos os pesos entre as camadas de entrada e oculta da rede de descrio, e concatena-se camada oculta a rede treinada para o reconhecimento. Uma abordagem similar foi proposta em (Bouattour et al., 1992), onde se descreve uma rede cujos pesos das camadas ocultas so inicializados de modo a filtrar as informaes de entrada. Assim, ao invs da inicializao randmica, a rede implementa filtros conhecidos, fazendo com que a fase de descrio seja mais robusta e menos sensvel a diferenas na iluminao. 2.4. Concluses A implementao do reconhecedor neural de faces mostrada no tpico anterior, usa uma rede neural para realizar uma decodificao de um conjunto de valores compreendidos entre 0 e 127, que representam a face da foto, em uma nova representao mais compacta. Essa nova representao composta pelos pesos sinpticos da rede neural, obtidos na etapa de compresso de dados. Fatores como variaes de iluminao influenciam os pixels da imagem (valores compreendidos entre 0 e 127 que representam a face). Porm, a rede neural, com sua capacidade de generalizao, consegue associar uma ent rada ruidosa (no exatamente igual entrada vista na etapa de treinamento) respectiva sada desejada. Outra variao que pode interferir no reconhecimento facial a distncia entre a cmera e a face fotografada. Pode haver distores na quantidade de pixels que representam um

51

determinado componente facial. Assim, um olho que antes era representado por 9 pixels dispostos bidimensionalmente 3x3 sob uma determinada distncia, pode vir a ser representado por 4 pixels dispostos 2x2 se a face se aproxima da cmera. A implementao descrita anteriormente transfere para a rede neural a tarefa de definir e estruturar a representao da face. Perde-se dessa forma, a noo da importncia ou no de determinado componente ou regio especfica da face na tarefa de reconhecimento. Na estrutura mostrada, tem-se uma viso global da face e a partir da busca-se a representao mais prxima da face analisada, comparando-se o resultado obtido pela rede com aqueles conseguidos durante o treinamento. O sistema hbrido inteligente aplicado ao reconhecimento facial proposto nesta dissertao, visa mensurar o grau de participao de componentes e regies da face na tarefa de reconhecimento facial. O sistema hbrido tem como entrada as relaes mtricas de componentes e regies faciais. Cada conjunto de relaes mtricas representa uma face. Dessa forma, busca-se um controle mais refinado de quais os componentes e regies realmente contribuem para o sucesso ou insucesso do reconhecimento. O uso das relaes mtricas de componentes faciais tambm visa minimizar a interferncia da variao de distncias entre cmera e face, bem como variaes de iluminao.

52

CAPTULO 3 MORFOLOGIA DA FACE HUMANA

As medidas e relaes mtricas que so usadas nesse trabalho foram pesquisadas de forma a se encontrar respaldo tcnico e embasamento anatmico na obteno de resultados e concluses. Dessa forma, torna-se necessrio um conhecimento mnimo da anatomia estrutural dos componentes faciais para o entendimento do problema e conseqente desenvolvimento da dissertao. As consideraes anatmicas expostas a seguir so de extrema importncia para o desenvolvimento desse trabalho, uma vez que elas interferem diretamente na formao esttica da face e podem ser decisivas na diferenciao entre rostos de pessoas distintas. 3.1. Introduo Segundo (Graziani, 1986), a face tem a forma de uma pirmide triangular com a base para baixo que se adapta e articula com a superfcie inferior do crnio. formada por partes sseas e partes moles, onde as partes sseas constituem um arcabouo o esqueleto facial com a funo de sustentar as partes moles que a ele se adaptam, formando as vrias regies superficiais e profundas do rosto. Para se conhecer a face humana necessrio que se avalie o seu esqueleto e suas partes moles. Algumas partes do esqueleto facial e pontos importantes de referncia craniomtrica podem ser analisadas sem a necessidade de uma radiografia (Graziani, 1986). So estas medidas e referncias, perceptveis a olho nu, que interessam nesta dissertao, visto que no ser aplicada nenhuma tcnica invasiva para obteno das medidas faciais. Sero tomadas somente as fotos frontais dos modelos a uma distncia aproximadamente constante e sob uma iluminao regular.

53

O esqueleto facial a estrutura ssea de sustentao da face, formada por um conjunto de catorze ossos. Esse conjunto geralmente chamado macio facial. Os ossos que o compem esto divididos em seis pares (maxilares superiores, nasais, lacrimais malares, palatinos e cornetos) e dois mpares (vmer e mandbula). O conjunto dividido em duas partes, uma superior fixa e outra inferior mvel. A parte inferior constituda por um nico osso, o maxilar inferior ou mandbula. A parte superior compreende todos os demais ossos, os quais se articulam entre si formando uma s pea que em anatomia se denomina maxilar superior ou maxila. Os tecidos moles revestem o esqueleto facial. As partes moles so constitudas pela pele, tecido celular subcutneo, camadas musculares correspondentes s diversas regies da face, vasos e nervos alm das glndulas salivares. Uma membrana epitelial reveste internamente as cavidades formadas entre os ossos (cavidade nasal, cavidade bucal) e as cavidades existentes no interior dos ossos (seios da face). Para a conveninc ia do seu estudo anatmico, a face dividida arbitrariamente em um determinado nmero de regies. Nos estudos relativos prtese facial, tambm aproveitveis nos estudos desse trabalho, convm a diviso adotada por Harry Shapiro mostrada na Figura 3.1 (Graziani, 1986): 1. regies orbitria (ou palpebral); 2. infra-orbitria; 3. zigomtica; 4. nasal; 5. bucal; 6. mentoniana; 7. bucinadora; 8. parotdeo- masseterina; 9. auricular; 10. temporal.

54

FIGURA 3.1 - Regies da face. FONTE: (Graziani, 1986), p. 6. Dos tecidos moles que recobrem o esqueleto facial, a pele um dos mais importantes, sob o enfoque de prtese restauradora e tambm sendo um importante tpico para os estudos aqui realizados. Sob a pele esto situados os msculos da expresso facial, que so relevantes na diferenciao entre pessoas, atravs de uma foto frontal. Estes msculos ainda so teis em aplicaes que objetivem reconhecer expresses faciais. A Morfologia Facial pode ser melhor estudada quando subdividida em 3 partes: 1) arquitetura do esqueleto facial; 2) antropometria; 3) esttica facial. Nos prximos tpicos a seguir estaro sendo detalhadas cada uma destas partes.

55

3.2. Arquitetura do Esqueleto Facial O conjunto de quatorze ossos que formam o arcabouo da face constitui uma unidade funcional, cujos elementos componentes no esto colocados casualmente uns ao lado dos outros. Eles so dependentes de leis particulares internas e tm uma importante conexo estrutural. Os ossos do esqueleto facial tm sua arquitetura adaptada s exigncias funcionais: as zonas sobre as quais atuam as maiores foras de presso e trao so justamente as mais reforadas, sob o ponto de vista mecnico (Graziani, 1986). Fatores como tipo de alimentao, hbitos alimentares e culturais das pessoas e ainda fatores vinculados etnia, podem ter influncia no desenvolvimento exagerado ou atrofia de estruturas do esqueleto facial, interferindo por sua vez na forma esttica apresentada pela face. O reforo estrutural, decorrente de tais fatores, pode ocorrer de duas maneiras: pelo espessamento das lminas compactas ou pelo espessamento e condensao das trabculas esponjosas que formam o esqueleto facial. No conjunto esqueleto- facial podem ser observados elementos arquitetnicos dispostos de forma a resistir ao de poderosos msculos, sendo capazes de suportar as foras exercidas durante a mastigao (Graziani, 1986). Tais estruturas podem ser suficientemente desenvolvidas a ponto de caracterizar uma face de forma a diferenci- la de outra. Podem ser verificadas importantes diferenas entre a arquitetura do maxilar superior e a da mandbula. Tais particularidades sero descritas a seguir. Maxilar superior ou Maxila: O maxilar superior, aqui considerando tambm os ossos do conjunto facial que se agregam a ele, se articula com o conjunto crnio- facial por meio de uma srie de sinartroses dotadas de grande eficincia mecnica. Estas sinartroses permitem maxila resistir s foras exercidas pela a ao dos msculos mastigadores, alm de distribuir estas foras (Graziani, 1986). O exerccio exagerado desses msculos, bem como a

56

ausncia de estmulos, pode causar respectivamente hipertrofias ou atrofias que influenciam no desenho facial. A observao do comportamento dessas estruturas pode ser um importante diferencial para o discernimento entre pessoas e raas distintas. Um exemplo de caractersticas ligadas a raas ou padres comportamentais o arco supra-orbitrio (estrutura 4 da Figura 3.2) super desenvolvidos em algumas raas primitivas. Segundo (Graziani, 1986), o arco supra-orbitrio, constitudo pela arcada orbitria do frontal. Ele une cada pilar canino (estrutura 1 da Figura 3.2) com o pilar zigomtico (estrutura 2 da Figura 3.2) do respectivo lado. A borda supra-orbitria sofre o contrachoque das foras da presso mastigatria. O reforo de tecido compacto do arco superciliar uma conseqncia disso, explicando-se o maior desenvolvimento desse arco em algumas raas humanas primitivas e nos antropides, (torus supraorbitais) cuja alimentao exigia maior presso mastigatria.

FIGURA 3.2 - Arquitetura do esqueleto facial. 1: Pilar canino. 2: Pilar zigomtico. 3: Arco infranasal. 4: Arco supra-orbitrio. 5: Arco infra-orbitrio. 6: Arco supranasal. FONTE: Graziani (1986), p. 7.

57

A maxila (ou maxilar superior) forma uma armao em forma de pirmide apoiada base do crnio, apresentando pilares de apoio, denominadas linhas de fora. Entre esses pilares formam-se as cavidades orbitrias, nasais e as cavidades pneumticas acessrias nasais (ou seios da face). Os pilares so reunidos por arcos de reforo que com eles constituem a base, o forte da armao. J os espaos entre eles so frgeis paredes de cavidades, constituindo verdadeiros espaos mortos, mecanicamente. O sistema de colunas de sustentao formado por trs pilares principais: 1. Pilar canino, 2. Pilar zigomtico, 3. Pilar pterigideo. Os pilares canino e zigomtico, podem ser vistos na Figura 3.2, correspondendo s estruturas de nmero 1 e 2. A seguir sero descritas algumas particularidades da Mandbula. Mandbula: A arquitetura da poro mvel do esqueleto facial (Graziani, 1986) a mandbula diferencia-se bastante da poro fixa. A mandbula um osso mvel, isolado, sujeito a foras de potentes e desenvolvidos msculos. Ela tem, necessariamente, que ser um osso de grande resistncia. De incio, apresenta uma grande linha de resistncia, chamada trajetria basilar (estrutura 1 da Figura 3.3), formada pelo espessamento ao longo da sua borda inferior. Esta trajetria, conforme vemos na Figura 3.3 , inicia-se no cndilo, caminha para a borda inferior, passando um pouco adiante do ngulo e depois de caminhar ao longo da borda inferior, at o nvel do canino, curva-se para cima e termina na borda superior, j na regio mentoniana.

58

Regio do Cnidilo

Regio mentoniana

FIGURA 3.3 Linhas de resistncia da mandbula. 1: Trajetria basilar. 2: Trajetria alveolar. 3: Trajetria coronoidal. 4: Trajetria condileana. FONTE: Graziani (1986), p. 8. A regio do mento tem ento, quando observada de frente, um sistema de resistncia em forma de V invertido, constituindo um reforo zona mais ameaada pelas foras de flexo e na qual pode-se observar fraturas, sobretudo em crianas e em feridos de guerra. Outra linha de resistncia observada ao longo do processo alveolar (estrutura 2 da Figura 3.3), partindo da apfise coronide, at atingir a linha mediana (trajetria aveolar). Na apfise coronide, a linha de resistncia destinada fora de trao do msculo temporal constitui a trajetria coronoidal (estrutura 3 da Figura 3.3). Finalmente, a trajetria condileana (estrutura 4 da Figura 3.3) assinalada tambm na Figura 3.3 , parte do cndilo e toma a direo da borda posterior do ramo ascendente. 3.3. Antropometria Facial Segundo (Graziani, 1986), os mtodos antropomtricos tm sido usados em algumas especialidades da odontologia, como por exemplo em ortodontia, odontologia legal e prtese restauradora. Alguns pontos e medidas antropolgicas so de sumo interesse

59

para a prtese maxilo- facial pois servem de guia para a reconstruo facial, sem desprezar as caractersticas originais da face. A confeco de uma prtese facial exige que um grande nmero de detalhes seja levado em considerao, tais como a esttica da face, a sua estrutura ssea e a construo de formas harmoniosas que se encaixem melhor ao perfil original. Tais medidas e direcionamentos, usados pelos profissionais de odontologia, so teis tambm para a tarefa de encontrar pontos relevantes ao reconhecimento facial. A seguir sero detalhadas algumas dessas caractersticas. 3.3.1. Pontos Craniomtricos Os pontos e medidas craniomtricas (Graziani, 1986) ou mais precisamente, prosopomtricas, permitem o conhecimento exato da forma e dimenses da face, possibilitando o diagnstico preciso das deformidades e a apreciao dos detalhes e variaes individuais e raciais. Os pontos craniomtricos esto situados sobre o esqueleto e so utilizados como referncia para as mensuraes e as relaes crnio- faciais. Infelizmente para essa dissertao, muitos desses pontos no podem ser precisamente determinados em indivduos vivos, ou ainda s so determinados atravs de raios-X e aparelhos especiais. Portanto, sero usadas neste trabalho apenas medidas e referncias possveis de se obter sem a necessidade de mtodos invasivos como radiografias ou ressonncias magnticas. A Figura 3.4 mostra a localizao de todos pontos craniomtricos.

60

FIGURA 3.4 - Pontos craniomtricos. FONTE: Graziani (1986), p. 8. Outra limitao para a escolha dos pontos craniomtricos a serem usados nesta dissertao o fato do tecido epitelial e dos msculos da face estarem presentes quando se analisa uma foto frontal de um indivduo vivo. Porm, alguns desses pontos mostrados na Figura 3.4 podem ser determinados com boa preciso atravs da anlise de imagens frontais da face de indivduos vivos. Pode-se tambm estabelecer certas relaes usando estas referncias craniomtricas e suas relaes mtricas como feito na odontologia. Especialmente neste caso, tais informaes sero usadas com a finalidade de diferenciar indivduos e no para correes de feies da face. Dentre os pontos craniomtricos que podem ser determinados com certa preciso em indivduos vivos e em fotos frontais, seguem-se: 1) frio: situado no meio do dimetro frontal mnimo (logo acima da glabela). Corresponde altura do assoalho endocraniano. 2) Glabela: uma proeminncia situada no osso frontal, entre as duas cristas superciliares, logo acima da raiz do nariz. No vivo, corresponde s extremidades internas das sobrancelhas.

61

3) Nsio: Situado no cruzamento do plano sagital com a sutura naso- frontal, podendo ser tambm determinado no vivo. 4) Gntio: chamado tambm ponto mentoniano, situa-se no ponto mais inferior e mais anterior da mandbula. 5) Gnio: situado no vrtice do ngulo da mandbula, podendo ser facilmente determinado no indivduo vivo; 6) Zigio: ponto lateral mais proeminente da arcada zigomtica; 3.3.2. Medidas Lineares De posse dos pontos craniomtricos citados no tpico anterior possvel realizar algumas medidas lineares importantes a este estudo de reconhecimento, tais como: Dimetro transverso mximo, bizigomtico ou bimalar: distncia entre os dois zgios. Altura morfolgica da face ou naso- mentoniana: distncia em projeo que vai do nsio ao gntio; representa a altura total da face. Altura frio-alveolar: distncia que vai do frio ao prstio. Altura nsio-alveolar: distncia entre o nsio e o prstio, que corresponde altura facial superior. Altura nasal: distncia entre o nsio e o naso-espinhal. Largura nasal: distncia mxima da abertura nasal. Largura interorbitria: distncia entre os dois pontos lacrimais. Largura orbitria: distncia entre o dcrio e a borda externa da rbita.

62

Altura orbitria: distncia entre a borda superior e a borda inferior da rbita, perpendiculares linha da largura.

Dimetro bigonaco: distncia entre os dois gnios. Comprimento do ramo ascendente da mandbula: distncia entre o gnio e o vrtice do cndilo.

Para cirurgias reparadoras e ainda confeco de prteses maxilo-faciais, pode-se contar com medidas angulares tomadas da face. Neste estudo, tais medidas no so vlidas uma vez que elas devem ser tomadas com o indivduo em posio perfilada e esta dissertao se destina a estudos de faces frontais. 3.3.3. ndice Facial denominado ndice Facial a relao existente entre a distncia nsio-gntica, multiplicada por 100 e dividida pela distncia bizigomtica (distncia entre os dois zgios). De acordo com esse ndice, tem-se uma classificao das faces em baixas, largas, mdias, altas e estreitas. Temos ento indivduos: Hipereuriprospicos Euriprospicos Mesoprospicos Leptoprospicos Hiperleptoprospicos abaixo de 80 de 80 a 85 de 85 a 90 de 90 a 95 acima de 95

O indivduo Euriprospico, mostrado na Figura 3.5 tem a face larga, fossas nasais e abbada palatina largas e baixas, zigomas salientes e arcadas dentrias largas e curtas. H preponderncia das medidas transversais.

63

FIGURA 3.5 - Face Euriprospica. FONTE: Graziani (1986), p. 12.

O indivduo leptoprospico, mostrado na Figura 3.6 tem caracteres opostos: face comprida e estreita, rbitas altas, fossas nasais elevadas e estreitas, zigomas pouco salientes, abbada palatina e arcadas dentrias alongadas. Predominam as dimenses verticais.

FIGURA 3.6 - Face leptoprospica. FONTE: Graziani (1986), p. 12.

64

Os indivduos mesoprospicos apresentam caractersticas intermedirias quelas mostradas nas figuras 3.5 e 3.6. J os indivduos que se encontram nos extremos da classificao segundo o ndice facial, apresentam o achatamento facial (indivduos hipereuriprospicos) ou um perfil extremamente comprido (indivduos

hiperleptoprospicos) como suas principais caractersticas. 3.4. Esttica Facial A esttica facial definida por (Graziani, 1986) como sendo a combinao perfeita de diferentes partes entre si, formando um todo concorrendo para um mesmo fim. importante discernir entre os conceitos do belo e do harmonioso. A beleza de uma face muitas vezes algo subjetivo e depende de questes pessoais e at culturais. J uma face harmoniosa, normal, algo mais palpvel e possvel de ser conceituado. Podese portanto considerar uma face como normal, quando ela no apresenta grandes distores em sua simetria vertical e grandes variaes de proporo entre componentes e regies. O estudo da face normal e o estudo da arte, em sua relao com a esttica e a beleza facial, so pontos chave para cirurgies voltados para a reconstituio facial e certamente fornecem pistas importantes para a diferenciao entre rostos humanos. O uso de mtricas e modelos faciais segundo (Chiche e Pinault, 1996) tem sido aplicado, no meio clnico, para encontrar uma composio agradvel no sorriso, podendo tambm ser aplicadas em reconstituies faciais, de modo a criar um arranjo dos vrios elementos estticos para uma proporo ou relao adequada, conforme os princpios conhecidos. Ainda segundo (Chiche e Pinault, 1996), h quatro fatores de composio esttica que podem ser fcil e efetivamente aplicados especificamente ao sorriso. Eles servem para auxiliar o clnico a determinar a apresentao adequada dos dentes, seu tamanho, arranjo e orientao em relao face durante o diagnstico esttico e o tratamento. Esses fatores so: Estruturas e referncias: sistema de construo que d a forma; um padro para medir ou construir.

65

Proporo e idealismo: relao de uma parte com a outra ou com o todo em relao grandeza, quantidade ou ao grau; um padro de perfeio, beleza ou excelncia.

Simetria: correspondncia de tamanho, forma e posio relativa das partes em lados opostos de uma linha divisria - ou plano mediano - ou ainda ao redor de um centro ou eixo.

Perspectiva e iluso:

tcnica ou processo de representar, em um plano ou

superfcie curva, a relao espacial de objetos como eles poderiam parecer sob o nosso olhar. A inteno deste tpico estudar as noes de simetria, estruturas e referncias presentes nos elementos de tecido mole que compem o rosto humano, bem como suas inter-relaes, com o objetivo de se criar uma heurstica aplicvel diferenciao de rostos humanos. Uma vez encontrada essa heurstica, poder-se-ia aplic-la em sistemas automticos de reconhecimento de rostos. Nos tpicos seguintes sero apresentadas mais algumas caractersticas teis classificao e diferenciao entre faces humanas. 3.4.1. Tipos Morfolgicos Enquanto estudiosos e artistas estabeleciam as relaes da expresso facial com os estados da alma, e a Esttica se preocupou com a harmonia da forma, outros cientistas trataram de investigar as relaes entre os caracteres funcionais ou tnicos, classificando o aspecto exterior da face em tipos morfolgicos (Graziani, 1986). Diversas classificaes sobre tipos morfolgicos podem ser encontradas na literatura. Na renascena, Drer artista da poca dividia as formas faciais em seis tipos diferentes, conforme a Figura 3.7.

66

FIGURA 3.7 - A face humana segundo a concepo artstica de Drer. FONTE: Graziani (1986), p. 21. As formas faciais continuaram despertando interesse, como mostrou em 1815 a autora inglesa Madame Schimmelpennick, em seu livro Cincia da Beleza, onde ela realizava a classificao das faces de acordo com a sua semelhana a 5 formas geomtricas: quadrado, retngulo, crculo, elipse e o tringulo, como mostrado na Figura 3.8.

67

FIGURA 3.8- Tipos faciais segundo Madame Schimmelpennick em seu livro "Cincia da Beleza". FONTE: Graziani (1986), p. 13. J em 1910, Cludio Sigaud, um mdico de Lyon, e ainda Chaillon Mac Auliff em 1912, estabeleceram 4 tipos morfolgicos principais: 1) 2) 3) 4) Tipo cerebral; Tipo respiratrio; Tipo digestivo; Tipo muscular.

Esses tipos de face so definidos atravs da criao de 2 linhas de referncia na face, delimitando-a em 3 regies mostradas na Figura 3.9. A primeira das linhas deve passar pela raiz do nariz e a segunda pela base do nariz. Dividida dessa forma, a face passa a ter a parte superior, acima da linha traada na raiz do nariz, sendo chamada de cerebral, compreendendo o frontal ao nvel dos lbulos anteriores do crebro. O segmento mdio, chamado de respiratrio constitudo pela zona do nariz e cavidades sinusais. O seguimento inferior chamado de digestivo,

68

sendo compreendido pela regio da boca, maxilares e arcadas dentrias. Os quatro tipos de face podem ser vistos na Figura 3.9.

FIGURA 3.9 - Tipos morfolgicos segundo a classificao de Claud Sigaud. FONTE: Graziani (1986), p. 13. O tipo cerebral caracteriza-se pela predominncia do segmento superior. A face apresenta a forma de uma pirmide invertida, resultando no maior volume do crnio, sendo que seus contornos esto inscritos em um tringulo de cspide inferior. o indivduo de face oval alongada, a fronte larga e elevada. Sua maxila, seios maxilares, boca e mandbula so de pequenas dimenses. O tipo respiratrio caracteriza-se pela predominncia do segmento mdio. Nariz, fossas nasais e cavidades sinusais volumosas, zigomas salientes. Espao inter-ocular aumentado, a fronte baixa e estreita. O seu segmento inferior tambm apresenta altura e largura reduzidas. No tipo digestivo a predominncia do segmento inferior. Boca grande, lbios grossos, dentes largos, mandbula larga, gnios salientes. Muitas vezes, apresenta prognatismo

69

mandibular. A fronte estreita e baixa, os olhos quase sempre pequenos e as plpebras geralmente infiltradas por tecido adiposo. O segmento mdio de reduzidas propores. A face apresenta a forma de um cone truncado ou de um trapzio. O tipo muscular apresenta os trs segmentos iguais, caracterizando-se pela igualdade das zonas cerebral, respiratria e digestiva. A face tem a forma retangular. retangular tambm a insero frontal dos cabelos. Possui os limites laterais da fronte no mesmo plano dos zigomas e da regio masseterina. Os olhos, boca e nariz so de dimenses medianas. Raramente encontram-se esses tipos faciais sob a sua forma pura, existindo entre eles as formas de transio (tipos mistos) quase sempre difceis de serem distinguidos. Outras classificaes faciais so encontradas nos estudos da fonoaudiologia. Analisando-se os tipos faciais possvel associar a eles certas patologias relacionadas a distrbios da fala e distrbios respiratrios, que por sua vez vm a interferir na esttica do rosto. Os tipos de face, segundo a classificao usada em fonoaudiologia, so os seguintes (DE Felcio, 1999): Dlico-facial: possuem a musculatura elevadora da mandbula mais delgada, quando comparada aos outros dois tipos faciais, sendo a insero do masseter prxima ao ngulo da mandbula e de forma oblqua. Esse tipo facial apresenta tendncia de crescimento facial no sentido vertical, sendo comum a verificao de m-ocluso caracterizada por mordida aberta esqueltica. Brqui- facial: caractersticas inversas s apresentadas pelo dlico-facial, isto , sua musculatura elevadora da mandbula espessa e sua insero no corpo da mandbula ampla. A tendncia do crescimento da mandbula no sentido horizontal (anti- horrio), sendo comum a presena de sobre- mordida. Meso-facial: estgio intermedirio entre os outros dois tipos de face.

70

3.4.2. Estruturas e Referncias Faciais Segundo Chiche e Pinault, (1996), os artistas desenham dentro de uma estrutura mensurvel geral que quadrada, retangular ou circular. Esta frmula posteriormente refinada com estruturas internas e pontos de referncia imaginrios, de modo a relacionar as partes entre si e a estrutura bsica. Na esttica facial, as cirurgias plsticas de reconstruo de partes duras (sseas) ou moles (cartilagens, msculos entre outros) do rosto em decorrncia de acidentes, mformao ou ainda para correo de patologias, devem sempre observar a inter-relao e harmonia com todas as estruturas que compem este rosto. Graziani, (1986) afirma que em presena de uma deformidade maxilofacial, o especialista dever estabelecer um padro de normalidade de acordo com a raa e o tipo do paciente. Existem estruturas referencias especficas que so usadas pelos profissionais de esttica para se orientarem no trabalho de reconstruo ou correo facial. Estas mesmas estruturas e inter-relaes so usadas neste trabalho para a tarefa de reconhecimento dentre pessoas diferentes. Como exemplo de algumas dessas referncias, podemos citar: linhas de referncia horizontais, linhas de referncia verticais, linha mediana da face, teros da face entre outros. A seguir, sero descritos os procedimentos e estratgias para se realizar uma anlise facial.

3.4.3. Anlise Facial


O ponto mais importante em uma anlise formal da esttica facial a utilizao de um padro clnico (Suguino et. al, 1996). O modelo instrudo a sentar-se na posio ereta, olhando para frente na linha do horizonte ou diretamente para um espelho na parede sua frente. Esta posio, chamada de posio natural da cabea, a que o paciente se conduz em seu dia-a-dia.

71

A posio natural da cabea, relao cntrica (posio mais superior do cndilo), e postura labial relaxada, devem ser observadas a fim de que os dados possam ser coletados adequadamente (Suguino et. al, 1996). Esta a posio de referncia, mostrada na Figura 3.10, que ser utilizada nessa dissertao para que se possa obter dados faciais-esquelticos confiveis a fim de reforar a segurana e qualidade dos resultados.

FIGURA 3.10 Posio natural da cabea. A linha vertical verdadeira perpendicular ao solo. A horizontal verdadeira paralela ao solo e definida a partir da pupila dos olhos. FONTE: Suguino et al (1996), p. 87.

Na viso frontal, a face deve ser examinada com os seguintes propsitos (Suguino et. al, 1996): Avaliao da simetria bilateral, conforme mostrado na Figura 3.11.A; Avaliao das propores de tamanho da linha mediana at as estruturas laterais (Figura 3.11.B); E avaliao da proporcionalidade vertical (Figura 3.11.C).

72

(A) (B) (C) FIGURA 3.11 Tpicos a serem avaliados na viso frontal. (A) Anlise facial vista frontal: simetria; (B) Anlise facial vista frontal: dimenses laterais; (C) Anlise facial vista lateral: proporcionalmente vertical. FONTE: Suguino et al (1996), p. 92.

Inicialmente observa-se a simetria direita e esquerda, traando-se uma linha vertical verdadeira (glabela - ponta de nariz e lbios), cruzando perpendicularmente linha da viso (horizontal verdadeira) dividindo a face em duas partes como mostrado na Figura 3.12.A (Viazis, 1996).

(A) (B) (C) FIGURA 3.12 Diviso da face em duas partes. (A) Anlise facial vista frontal: linha vertical verdadeira = simetria; (B) (C) Assimetria aceitvel FONTE: Suguino et al (1996), p. 92.

73

Certamente no h face perfeitamente simtrica, contudo a ausncia de algumas assimetrias necessria para uma boa esttica facial (Epker e Fish, 1986). Essa assimetria normal, a qual resulta de uma pequena diferena de tamanho entre os dois lados de um rosto humano ilustrada na Figura.3.12.B e C, pode ser utilizada para caracterizar indivduos diferentes, da mesma forma como usado para personalizar exames clnicos ortodnticos. O balano geral da face (proporcionalidade vertical) determinado a seguir, baseado no equilbrio dos teros superior, mdio e inferior da face, aproximadamente iguais em altura vertical. 1) Tero Superior da Face (Linha do Cabelo at as Sobrancelhas) O tero superior da face definido como sendo a poro entre a linha da raiz do cabelo e a linha das sobrancelhas. altamente varivel dependendo do estilo do cabelo, o que o torna uma medida no to confivel (Suguino et al., 1996). Contudo, pode-se observar anormalidades na configurao geral e simetria da calvria, especificamente de reas temporal, frontal e sobrancelhas. As anormalidades nestas reas so freqentemente associadas com vrias sndromes craniofaciais. Estas reas usualmente so normais em deformidades dentofaciais (Epker e Fish, 1986). 2) Tero Mdio da Face Sobrancelhas a Subnasal O tero mdio definido como a faixa compreendida entre a linha das sobrancelhas e a base do nariz (linha subnasal) (Suguino et al., 1996), (DE Almeida et al., 1999). Nesta regio, avaliam-se os olhos, as rbitas, o nariz, as bochechas e as orelhas. So determinadas as medidas das distncias intercantal e interpupilar. Segundo (Suguino et al., 1996), o valor mdio destas medidas no sofre grandes variaes de um indivduo para outro, embora pessoas de raa negra freqentemente apresentem valores maiores para a distncia intercantal e interpupilar. Estes valores so estabelecidos por volta dos 6 a 8 anos de idade e no mudam significantemente aps esta poca (Epker e Fish, 1986).

74

Juntamente horizontal verdadeira, a face principal pode ser dividida em trs teros: largura ocular direita, largura nasal e largura ocular esquerda conforme mostra a Figura 3.13.A (Suguino et al., 1996). A face como um todo, de um olho a outro, em relao horizontal verdadeira, tambm pode ser dividida em teros iguais: largura facial direita, largura da boca e largura facial esquerda mostrado na Figura 3.13.B (Suguino et al., 1996).

(A) (B) FIGURA 3.13 Divises verticais da face. (A) Largura ocular direita, largura nasal, largura ocular esquerda; (B) Largura facial direita, largura da boca, largura facial esquerda. FONTE: Suguino et al (1996), p. 93. Na avaliao das bochechas, observado a eminncia malar, borda infraorbital e reas paranasais. Finalmente, as orelhas so observadas. A simetria, nvel e projeo so importantes (Suguino et al., 1996). 3) Tero Inferior da Face - Subnasal ao Mento O tero inferior definido como a faixa compreendida entre a linha subnasal e o mento (Suguino et al., 1996), (DE Almeida et al., 1999).

75

O comprimento vertical normal do tero inferior da face aproximadamente igual ao do tero mdio da face quando existe uma boa esttica. Alm disso, a proporo da distncia vertical do subnasal ao estmio do lbio superior, e deste ao tecido mole do mento em torno de 1:2. A proporo da distncia vertical do subnasal margem cutnea do vermelho do lbio inferior e deste ao tecido mole do mento de 1:1, como ilustrado na Figura 3.14. Estas medidas devem ser realizadas com a musculatura facial em repouso.

FIGURA 3.14 - Proporo 1:1 da distncia vertical do subnasal margem cutnea do vermelho do lbio inferior e deste ao tecido mole do mento. FONTE: Suguino et al (1996), p. 92. Um outro ponto importante para o exame da face a avaliao da linha mdia. A linha mdia dentria deveria ser coincidente entre si e com a linha mdia facial. O mento avaliado quanto sua simetria, relaes verticais e morfologia ou forma. A forma comparada com o resto da face. Muito freqentemente o mento mais pronunciado do que o resto da face. Por fim, os ngulos mandibulares so avaliados com ateno para a assimetria e volume, podendo ser deficientes, normal ou excessivo (Suguino et al., 1996). Desta forma, completa-se a avaliao esttica frontal.

76

CAPTULO 4 METODOLOGIA APLICADA

A metodologia usada nesta dissertao visa ressaltar a importncia e aplicabilidade das medidas geomtricas da face humana na tarefa de distino entre diferentes rostos. As medidas faciais extradas e usadas aqui seguem padres anatmicos utilizados em outras cincias (ortodontia, fonoaudiologia e reconstituio facial) que tratam da beleza esttica, simetrias e anomalias da face humana. Procura-se, durante todo o trabalho, observar as relaes existentes entre a morfologia do rosto, a raa, o sexo e as anomalias. Nos prximos tpicos sero descritas as etapas seguidas neste trabalho para executar o reconhecimento facial. 4.1. Introduo Como foi visto no Captulo 1, os mtodos geomtricos comearam a ser usados no discernimento de faces na dcada de 60, chegando a atingir ndices de acerto da ordem de 90%. O interesse por esse mtodo decaiu devido a sua vulnerabilidade, apresentada na poca, em tratar situaes adversas como as rotaes da imagem, baixa robustez no tratamento de entradas com rudos, alm da dificuldade de se padronizar quais medidas e relaes eram realmente capazes de realizar a tarefa de reconhecimento facial. A seguir, descreve-se uma metodologia usada para construir um sistema com base em redes neurais artificiais e estudos relacionados biometria capaz de realizar o reconhecimento de faces. Este sistema proposto combina as vantagens dos mtodos geomtricos (robustez a variao de iluminao e escala por exemplo) e as caractersticas das redes neurais (no linearidade, mapeamento de entrada e sada, adaptabilidade, tolerncia falhas, capacidade de generalizao, entre outras).

77

O sistema aqui descrito estuda quais so as mtricas relevantes para o reconhecimento facial, levando em considerao padres anatmicos faciais ligados ao sexo, raa e simetria. Descrevem-se tambm limitaes ambientais, heursticas e o uso de inteligncia computacional, atravs do uso de redes neurais artificiais, a fim de aumentar a robustez do sistema, tornando possvel a sua aplicao a uma situao real de reconhecimento de faces. 4.2. Descrio das Etapas O sistema aqui descrito, parte da premissa que sempre haver um rosto presente na foto avaliada. Considera tambm que a posio desse rosto bem conhecida. Portanto a primeira premissa, relacionada deteco da presena de um rosto na imagem se encontra satisfeita. Com relao aquisio de imagens de faces, foi criado um banco de fotos, contendo 22 faces de funcionrios da Aominas S.A. e 15 fotos de faces do banco de imagens disponibilizadas pela Universidade de Yale. Todas as fotos so de faces em posio frontal. As imagens foram coletadas sem grandes variaes na iluminao da cena e tambm buscando no variar muito a distncia entre a pessoa fotografada e a cmera. Entre as pessoas fotografadas h homens e mulheres adultos de diferentes etnias para garantir uma coerncia do banco de imagens com o mundo real. Conforme descrito no Captulo 3, sub-item 3.4.3 referente anlise facial, o modelo instrudo a sentar-se na posio ereta, olhando para frente na linha do horizonte, permanecendo com sua expresso facial neutra. Esta posio, chamada de posio natural da cabea, aquela na qual a pessoa normalmente se encontra em seu dia-a-dia. Aps a aquisio das imagens que sero usadas na etapa de extrao de caractersticas, inicia-se a fase de tratamento das fotos, com o objetivo de realar as caractersticas de interesse para o reconhecimento facial. Foram usados filtros construdos com base nas tcnicas de processamento digital de imagens. Esses filtros podem ser aplicados sobre

78

as fotos para melhorar a identificao de arestas e salincias na face, alm de possibilitar o isolamento de texturas que no interessam ou que atrapalhem a coleta das mtricas faciais. A Figura 4.1 mostra um dos filtros implementados sendo aplicado a uma foto.

FIGURA 4.1 - Tratamento de imagens buscando realar caractersticas de interesse. A prxima fase, aps o tratamento das imagens, a coleta das mtricas faciais. A coleta das mtricas segue as orientaes fornecidas no Captulo 3 desta dissertao, referente a Morfologia da Face. As mtricas usadas esto baseadas em pontos de referncia faciais e medidas lineares teis ortodontia e reconstituio maxilofacial. So usadas tambm caractersticas do tecido mole da face visando a distino de tipos faciais diferentes como os mostrados nas figuras 3.7, 3.8 e 3.9 do Captulo 3 . As 13 medidas coletadas foram as seguintes: 1 tero da face 2 tero da face 3 tero da face altura do olho direito largura do olho direito altura do olho esquerdo largura do olho esquerdo altura do nariz (T1); (T2); (T3); (ODY); (ODX); (OEY); (OEX); (NY);

79

largura do nariz altura da boca largura da boca altura da face largura da face

(NX); (BY); (BX); (FY); (FX).

Estas medidas foram determinadas de forma manual, usando-se o ambiente de coleta de mtricas faciais. Tal ambiente permite que seja posicionada uma linha de referncia sobre a face, variando suas coordenadas X (em caso de coleta de distncias horizontais) e Y (em caso de distncias verticais), de forma a definir a variao de pixels entre o incio e o fim da rea ou componente facial medido. O funcionamento do ambiente de coleta bem simples. Uma vez que a imagem se encontra na janela de coleta, pressiona-se o boto de coleta de mtricas. Surge neste momento uma solicitao para o posicionamento da linha que aparece sobre a imagem, no ponto inicial da regio ou componente da face que se deseja medir. A movimentao da linha feita atravs das teclas de setas do teclado ou atravs dos botes de rolagem presentes no formulrio. Uma vez posicionada a linha no ponto de incio da medida desejada, pressiona-se novamente o boto de coleta de mtricas. O valor da coordenada inicial ento armazenado e solicita-se que se posicione a linha no ponto final da regio de interesse. Aps o posicionamento, pressiona-se o boto de coleta e o valor da coordenada final armazenado. De posse dos valores das coordenadas inicial e final de interesse feita uma subtrao simples e se obtm o valor em pixels da regio medida. A seguir descreve-se como foi determinada cada uma das regies de interesse na face. A face humana foi subdividida horizontalmente em 3 regies chamadas teros faciais. O primeiro tero (T1) corresponde distncia vertical compreendida entre a linha da raiz do cabelo e a linha das sobrancelhas como mostrado na Figura 4.2.

80

FIGURA 4.2 - Coleta da medida do primeiro tero da face. O segundo tero (T2) da face a distncia vertical compreendida entre a linha das sobrancelhas e a linha sub-nasal como mostrado na Figura 4.3.

FIGURA 4.3 - Coleta da medida do segundo tero da face. Finalmente, o terceiro tero (T3) da face a distncia compreendida entre a linha subnasal e a linha mentoniana, (linha tangente ao queixo) como mostrado na Figura 4.4.

FIGURA 4.4 - Coleta da medida do terceiro tero da face.

81

As medidas referentes aos olhos foram tomadas da seguinte forma: Largura do olho direito (ODX): a distncia horizontal compreendida entre o canto externo do olho direito e a lateral externa (ou asa) do nariz, como mostrado na Figura 4.5. Evitou-se tomar a distncia entre os cantos externos e internos do olho como sendo a largura ocular, para contornar problemas relativos a rotaes da cabea no momento da foto. Tais rotaes podem ocultar o canto interno do olho. A medida da largura ocular no igual para os dois olhos, devido a pequenas variaes de posicionamento que podem ocorrer no momento da foto, ou mesmo por motivos de assimetria facial. Pequenas diferenas so normais no s comparando-se os olhos, mas tambm quando se avalia o lado direito da face em relao ao esquerdo (assimetria normal da face).

FIGURA 4.5 - Coleta da medida da largura do olho. Altura do olho direito (ODY): foi definida aqui como a medida vertical compreendida entre a linha horizontal que passa pela parte visvel superior da ris e a linha horizontal que passa pela parte inferior visvel da ris, como mostra a Figura 4.6:

82

FIGURA 4.6 - Coleta da medida da altura do olho. As mtricas referentes ao nariz foram obtidas da seguinte forma: Largura nasal (NX): a distncia horizontal compreendida entre as partes externas das narinas, conforme mostrado na Figura 4.7.

FIGURA 4.7 - Coleta da medida da largura do nariz. Altura do nariz (NY): a distncia vertical compreendida entre a raiz do nariz (linha que tangencia a parte superior visvel da ris) e a linha sub-nasal, mostrado na Figura 4.8.

83

FIGURA 4.8 - Coleta da medida da altura do nariz. As mtricas referentes boca foram coletadas com se segue: Largura da boca (BX): a medida da distncia horizontal compreendida entre os cantos da boca, mostrado na Figura 4.9.

FIGURA 4.9 - Coleta da medida da largura da boca. Altura da boca (BY): a medida da distncia vertical compreendida entre as linhas horizontais tangentes ao lbio superior e inferior, como mostrado na Figura 4.10.

84

FIGURA 4.10 - Coleta da medida da altura da boca. So necessrias ainda as medidas da largura da face (FX), que representada pela distncia entre os dois zigios, como mostra a Figura 4.11 e a altura da face (FY), que definida aqui como a distncia nsio- mentoniana mostrada na Figura 4.12.

FIGURA 4.11 - Coleta da medida da largura da face

FIGURA 4.12 - Coleta da medida da altura da face.

85

De posse dessas mtricas, realiza-se uma classificao prvia do tipo de face com o qual se est trabalhando. As faces so ento classificadas em 5 classes:

hipereuriprospico; euriprospico; mesoprospico; leptoprospico; hiperleptoprospico.


A distribuio das faces dentro das 5 classes feita avaliando-se o ndice facial apresentado pelas faces analisadas. O ndice facial a relao existente entre a altura facial (distncia nsio- gntio ou nsio- mentoniana) dividida pela largura facial (distncia bizigomtica distncia entre os zgios da face) e multiplicada por 100. De acordo com esse ndice, tem-se a classificao das faces em baixas (hipereuriprospico), largas (euriprospico), mdias (mesoprospico), altas

(leptoprospico) e estreitas (hiperleptoprospico) segundo as relaes de intervalos descritas na Tabela 4.1 abaixo: TABELA 4.1 - Classificao facial segundo o ndice facial apresentado. hipereuriprospico Euriprospico Mesoprospico Leptoprospico hiperleptoprospico abaixo de 80 de 80 a 85 de 85 a 90 de 90 a 95 acima de 95

86

Cada face ser representada por um vetor definido na etapa de estruturao dos vetores de mtricas faciais. Esse vetor ser a entrada para a rede de reconhecimento facial. A etapa de reconhecimento, ser realizada em duas fases distintas. A inteno ao dividir a tarefa de reconhecimento em duas fases complementares segue a estratgia "dividir para conquistar". Primeiramente faz-se uma pr-seleo entre os padres, para se evitar comparar detalhes entre faces que nada tm em comum. Uma vez separadas as faces em classes distintas, contendo caractersticas em comum, parte-se para a segunda fase, o "ajuste fino", onde so observados os detalhes de cada uma das faces daquela classe a fim de diferenci-las. Na primeira fase dever ser sinalizado se a face conhecida ou no. Nessa fase, existem 5 redes neurais independentes, uma para cada classe de face. Cada rede responsvel por avaliar se a face apresentada na sua entrada conhecida ou no. Em caso positivo, ela ser submetida segunda etapa de reconhecimento. Em caso de respostas negativas apresentadas pelas 5 redes, o padro ser sinalizado como desconhecido e uma ao referente ao desconhecimento da face ser disparada (para o caso de um sistema de acesso por exemplo, poderia ser solicitada uma senha numrica, ou o auxlio de um operador humano). Todas as 5 redes tero o mesmo nmero de neurnios, a mesma estrutura de camadas, sendo tambm treinadas com o mesmo algoritmo, o retropropagao do erro. A segunda etapa do reconhecimento facial consiste em realizar a associao entre a entrada, sinalizada como conhecida pela fase 1 e uma das faces que estavam presentes na etapa de treinamento. Apenas uma sada das 5 redes da etapa 1 poder estar ativa, pois a entrada dever ser apresentada a somente uma das 5 redes da etapa 2. As 5 redes neurais da segunda etapa tambm so independentes, porm apenas 1 delas pode estar ativa num dado momento. A configurao das redes dentro de cada etapa idntica, bem como o algoritmo usado no treinamento. No prximo tpico sero descritas as estruturas usadas nos testes.

87

4.3. Descrio das Estruturas Utilizadas Durante a etapa de coleta das mtricas faciais, foram obtidas 13 medidas de faces de 22 pessoas pertencentes ao corpo de funcionrios da Aominas S.A.. Tambm foram usadas 15 imagens de faces pertencentes Universidade de Yale. As mtricas dos dois grupos esto descritas nas Tabelas 4.2 e 4.3 a seguir. A primeira linha da tabela corresponde abreviao usada para representar o componente ou regio da face, de acordo com a nomenclatura apresentada no tpico anterior. J a primeira coluna esquerda se refere identificao de cada face usada. Os valores das medidas so dados em pixels. TABELA 4.2 - Mtricas das 22 faces do corpo de funcionrios da aominas s..
100365 100525 100539 101604 104743 107147 107879 12646 304768 88643 912380 100160 100270 100370 100560 100636 104730 104790 39609 46506 50454 912715 T1 47 56 48 64 52 49 54 50 60 48 46 59 45 49 46 43 50 42 44 43 47 41 T2 61 79 60 66 62 55 58 62 61 62 56 62 58 58 66 62 67 57 63 72 58 69 T3 62 76 70 70 58 61 63 70 60 58 68 61 71 60 70 65 62 58 60 64 62 63 ODX 28 35 27 32 27 29 24 24 29 27 31 25 33 29 27 30 23 23 24 29 29 29 ODY 10 12 10 12 10 10 9 10 10 10 12 9 10 10 12 11 11 8 9 10 11 10 OEX 27 31 26 27 26 28 26 24 25 25 27 29 31 27 28 27 22 22 23 26 18 25 OEY 10 13 10 12 11 9 6 9 9 10 11 10 10 10 12 11 11 8 11 12 10 11 NX 33 48 36 37 36 29 38 38 36 36 43 35 32 35 36 34 42 29 37 44 44 38 NY 43 51 48 52 44 42 46 42 46 48 43 47 41 45 53 49 51 42 49 55 43 53 BX 48 62 51 54 52 46 47 48 42 46 60 53 47 50 48 43 50 46 57 58 54 53 BY 19 20 18 14 15 10 23 13 22 14 28 16 21 12 20 21 16 16 15 10 10 16 FY 106 127 119 124 102 104 111 111 106 106 111 109 112 103 122 112 111 100 110 120 100 115 FX 125 150 117 135 123 105 126 135 118 113 130 122 121 119 117 119 131 98 109 140 131 125

88

TABELA 4.3 - Mtricas das 15 faces do banco de faces da universidade de yale.


pessoa1 pessoa2 pessoa3 pessoa4 pessoa5 pessoa6 pessoa7 pessoa8 pessoa9 pessoa10 pessoa11 pessoa12 pessoa13 pessoa14 pessoa15 T1 54 75 50 55 73 53 47 79 56 52 0 80 40 48 53 T2 73 83 78 90 83 83 77 89 75 81 79 87 76 87 81 T3 ODX ODY OEX OEY 84 33 11 33 13 79 34 13 39 12 72 33 11 31 11 78 36 11 34 10 90 36 10 29 10 74 38 12 35 10 83 28 11 32 12 65 34 14 25 14 76 36 13 34 14 77 40 12 28 12 70 38 14 40 12 90 35 12 36 12 68 32 13 26 10 71 36 8 39 9 72 35 10 32 11 NX 46 47 41 48 43 46 43 47 39 46 45 48 43 49 40 NY 57 68 57 67 59 59 57 68 59 57 66 62 58 63 63 BX 69 49 60 62 64 64 56 56 54 63 71 79 54 62 63 BY 20 18 23 27 19 21 22 21 20 27 17 19 19 21 20 FY 140 144 132 144 151 137 140 136 134 140 140 153 126 132 132 FX 161 151 139 161 160 163 150 161 145 161 158 161 137 158 155

As Figuras 4.13 e 4.14 mostram uma avaliao grfica dos valores coletados em ambas as bases de imagens. Avaliando a curva dos grficos, possvel notar o comportamento semelhante apresentado pelos dois grupos de faces. Porm, nota-se que h uma separabilidade, ainda que pequena, entre as linhas que representam cada pessoa nos dois bancos de imagens. Com base nesta observao, o objetivo do sistema hbrido inteligente conseguir separar as faces usando as informaes referentes s medidas coletadas.

89

Medidas Puras de Componentes e Regies Faciais - Banco de imagens Aominas 160 140 120 100 80 60 40 20 0
OE X BX NX OE Y OD X OD Y BY NY T1 T2 T3 Fa ce Y Fa ce X

100365 100525 100539 101604

Valores (em pixels)

104743 107147 107879 12646 304768 88643 912380 100160 100270 100370 100560 100636 104730

Componentes / Regies

FIGURA 4.13 Medidas puras dos componentes e regies faciais do banco de imagens da Aominas.

Medidas Puras de Componentes e Regies Faciais - Faces do banco de imagens de Yale 180 pessoa1 pessoa2 pessoa3 pessoa4 pessoa5 pessoa6 pessoa7 pessoa8 pessoa9 pessoa10 pessoa11
Ol ho Dy Ol ho Ex Ol ho Ey Bo ca Y Fa ce Y Fa ce X Na riz X Na riz Y Bo ca X

Valores (em pixels)

160 140 120 100 80 60 40 20 0


Te ro 1 Te ro 2 Te ro 3 Ol ho Dx

pessoa12 pessoa13 pessoa14 pessoa15

Componente / Regio Facial

FIGURA 4.14 Medidas puras dos componentes e regies faciais do banco de imagens de Yale.

90

A partir destas medidas, foram criadas relaes entre a altura e largura de componentes da face (olho, nariz e boca) e regies (T1, T2 e T3) a presentes. Tambm foram geradas mtricas relacionando os componentes e as regies faciais, visando buscar relaes mpares que sejam capazes de distinguir uma face da outra. A princpio, pensou-se em realizar todas as combinaes possveis entre as mtricas coletadas, o que resultaria em 78 combinaes

(C )
13 2

para alimentar as redes de

reconhecimento. Aps a realizao de alguns testes preliminares percebeu-se que determinadas relaes estabelecidas eram redundantes. Estas relaes ainda

dificultavam o aprendizado da rede, apresentavam alta vulnerabilidade a variaes de aparncia e pouco contribuam para o discernimento das faces. Desta forma, optou-se por eliminar a avaliao de um dos olhos (OEX e OEY), pois as informaes eram redundantes em relao ao outro olho. Eliminou-se tambm as relaes onde havia a presena do primeiro tero facial (T1), pois esta mtrica se mostrou muito sensvel a variaes de penteados. O nmero de combinaes a serem avaliadas caiu para 45 possibilidades C

10 2

), mas

ainda no era possvel determinar quais combinaes eram mais aptas tarefa de reconhecimento facial. Atravs da anlise do grfico de variaes dos componentes e regies da face, mostrado na Figura 4.15, pode-se perceber quais as medidas que variam mais de pessoa para pessoa e assim, selecionar de forma mais inteligente quais as relaes mtricas que facilitam o trabalho de reconhecimento.

91

Anlise da Variao dos Componentes e Regies da Face

160 140

120 100 80 60 40 20 0 12646 88643 39609 46506 100365 100525 100539 101604 104743 107147 107879 304768 912380 100160 100270 100370 100560 100636 104730 104790 50454 912715

T1 T2 T3 ODX ODY OEX OEY NX NY BX BY FaceY FaceX

Valores (em pixels)

Identificao das Faces

FIGURA 4.15 Anlise de componentes e Regies da Face Banco de Imagens da Aominas. A Figura 4.16 mostra o grfico das relaes mtricas estabelecidas tomando por base a variao dos componentes faciais. Nestas relaes j esto descartadas as medidas que apresentam como um de seus elementos, o primeiro tero facial (T1), a largura do olho esquerdo (OEX) e a altura do olho esquerdo (OEY) .

92

Avaliao das Relaes entre Componentes e Regies da Face


1,2000

T2/T3
1,0000

Ox/Oy Nx/Ny Bx/By Nx/Fx Fy/Fx T2/Fy T3/Fy T2/Fx T3/Fx

Valores normalizados

0,8000

0,6000

0,4000

0,2000

0,0000 12646 88643 39609 46506 100365 100525 100539 101604 104743 107147 107879 304768 912380 100160 100270 100370 100560 100636 104730 104790 50454 912715

Identificao das faces

FIGURA 4.16 Relaes entre componentes e Regies da Face. Banco de Imagens da Aominas. As relaes mostradas na Figura 4.16 foram definidas com base nas observaes anatmicas da face usadas por outras cincias, na tentativa de estabelecer ligao entre componentes com relao direta. No foram avaliadas neste trabalho as relaes existentes entre os componentes, olho X boca, olho X nariz e nariz X boca pois h uma certa proporcionalidade entre esses elementos, segundo (Graziani, 1986). A princpio, imagina-se que esta proporcionalidade poderia tornar a informao obtida redundante e pouco expressiva com base na morfologia facial e nos estudos das medidas e relaes existentes entre estes componentes. O uso de relaes proporcionais, ao invs das medidas puras adquiridas na fase de coleta das mtricas, se deve a preocupao em tornar o sistema m enos vulnervel a variaes de distncia entre a cmera e a pessoa fotografada. O valor em pixels, determinado durante uma coleta na imagem, pode variar significativamente com uma

93

aproximao ou afastamento da cmera. Porm a relao entre a altura e largura de um componente facial e ainda as propores apresentadas por dois diferentes componentes, permanecem constantes. Os valores obtidos das propores de um componente facial e entre diferentes componentes foram normalizadas e se encontram descritos nas T abelas 4.4A e 4.4B a seguir. TABELA 4.4A - Relaes normalizadas dos 22 funcionrios da aominas s.a.
Pessoas 100365 100525 100539 101604 104743 107147 107879 12646 304768 88643 912380 100160 100270 100370 100560 100636 104730 104790 39609 46506 50454 912715 T2 /T3 0,8746 0,9240 0,7619 0,8381 0,9502 0,8015 0,8183 0,7873 0,9037 0,9502 0,7320 0,9035 0,7261 0,8593 0,8381 0,8479 0,9606 0,8736 0,9333 1,0000 0,8315 0,9735 ODX /ODY 0,8485 0,8838 0,8182 0,8081 0,8182 0,8788 0,8081 0,7273 0,8788 0,8182 0,7828 0,8418 1,0000 0,8788 0,6818 0,8264 0,6336 0,8712 0,8081 0,8788 0,7989 0,8788 NX /NY 0,7500 0,9198 0,7330 0,6954 0,7996 0,6748 0,8073 0,8842 0,7648 0,7330 0,9773 0,7278 0,7627 0,7601 0,6638 0,6781 0,8048 0,6748 0,7379 0,7818 1,0000 0,7007 BX /BY 0,4356 0,5345 0,4885 0,6650 0,5977 0,7931 0,3523 0,6366 0,3292 0,5665 0,3695 0,5711 0,3859 0,7184 0,4138 0,3530 0,5388 0,4957 0,6552 1,0000 0,9310 0,5711 NX / FX 0,7777 0,9427 0,9064 0,8074 0,8622 0,8136 0,8885 0,8292 0,8988 0,9385 0,9744 0,8451 0,7791 0,8665 0,9064 0,8417 0,9445 0,8718 1,0000 0,9259 0,9895 0,8956 FY /FX 0,8132 0,8120 0,9754 0,8809 0,7953 0,9499 0,8448 0,7885 0,8615 0,8996 0,8189 0,8568 0,8877 0,8301 1,0000 0,9026 0,8126 0,9786 0,9678 0,8220 0,7321 0,8823 T2/ FY 0,9251 1,0000 0,8106 0,8557 0,9772 0,8502 0,8400 0,8979 0,9251 0,9403 0,8110 0,9144 0,8325 0,9052 0,8697 0,8899 0,9704 0,9163 0,9207 0,9646 0,9324 0,9646 T3 /FY 0,9227 0,9440 0,9279 0,8905 0,8970 0,9252 0,8953 0,9948 0,8929 0,8631 0,9664 0,8828 1,0000 0,9189 0,9051 0,9155 0,8811 0,9149 0,8604 0,8413 0,9780 0,8642 T2 /FX 0,8390 0,9055 0,8817 0,8405 0,8666 0,9006 0,7914 0,7896 0,8888 0,9433 0,7406 0,8737 0,8241 0,8380 0,9699 0,8958 0,8793 1,0000 0,9937 0,8842 0,7612 0,9491 T3 /FX 0,8290 0,8469 1,0000 0,8667 0,7882 0,9710 0,8357 0,8667 0,8499 0,8579 0,8743 0,8357 0,9808 0,8427 1,0000 0,9130 0,7911 0,9892 0,9201 0,7641 0,7911 0,8424

94

TABELA 4.4B - Relaes normalizadas da 15 faces da universidade de yale.


Pessoas pessoa1 pessoa2 pessoa3 pessoa4 pessoa5 pessoa6 pessoa7 pessoa8 pessoa9 pessoa10 pessoa11 pessoa12 pessoa13 pessoa14 pessoa15 T2 /T3 0,5289 0,7811 0,5714 0,5802 0,6674 0,5893 0,4659 1,0000 0,6063 0,5556 0,0000 0,7314 0,4840 0,5562 0,6057 ODX /ODY 0,8690 1,0506 1,0833 1,1538 0,9222 1,1216 0,9277 1,3692 0,9868 1,0519 1,1286 0,9667 1,1176 1,2254 1,1250 NX /NY 0,6347 0,7673 0,7912 0,8427 0,6735 0,8192 0,6775 1,0000 0,7207 0,7683 0,8242 0,7060 0,8163 0,8949 0,8216 BX /BY 3,0000 2,6154 3,0000 3,2727 3,6000 3,1667 2,5455 2,4286 2,7692 3,3333 2,7143 2,9167 2,4615 4,5000 3,5000 NX / FX 0,6667 0,5812 0,6667 0,7273 0,8000 0,7037 0,5657 0,5397 0,6154 0,7407 0,6032 0,6481 0,5470 1,0000 0,7778 FY /FX 0,8070 0,6912 0,7193 0,7164 0,7288 0,7797 0,7544 0,6912 0,6610 0,8070 0,6818 0,7742 0,7414 0,7778 0,6349 T2/ FY 3,4500 2,7222 2,6087 2,2963 3,3684 3,0476 2,5455 2,6667 2,7000 2,3333 4,1765 4,1579 2,8421 2,9524 3,1500 T3 /FY 0,8261 0,6518 0,6246 0,5498 0,8065 0,7297 0,6095 0,6385 0,6465 0,5587 1,0000 0,9956 0,6805 0,7069 0,7542 T2 /FX 0,9103 0,9917 0,9398 0,9499 0,8563 0,8991 0,9133 0,9301 0,8569 0,9103 0,9074 0,9499 1,0000 0,9881 0,8222 T3 /FX 0,8696 0,9536 0,9496 0,8944 0,9438 0,8405 0,9333 0,8447 0,9241 0,8696 0,8861 0,9503 0,9197 0,8354 0,8516

Aps a normalizao das 10 relaes mtricas das faces usadas como padres de entrada para a rede neural, o prximo passo foi definir a estrutura de rede que efetivamente far o papel de reconhecimento das faces. Para tanto, definiu-se que haveria 2 etapas para o reconhecimento dos rostos como descrito anteriormente. A primeira etapa caracteriza-se pela sinalizao de que a face apresentada conhecida ou no. A segunda etapa est relacionada com a associao da entrada apresentada rede, com uma das pessoas conhecidas pela rede ativa naquele momento. Cada uma das 5 classes de faces, determinadas pelos ndices faciais, possui uma rede especializada em afirmar se o padro de entrada conhecido ou no. Se a face apresentada na entrada da rede sinalizada como "no conhecida" por todas as 5 redes da primeira etapa de reconhecimento, a face imediatamente rechaada, no chegando a ser apresentada para nenhuma das 5 redes seguintes. Estas 5 redes da segunda etapa associam as faces na entrada a padres aprendidos durante o treinamento. Quando a face sinalizada como "conhecida", por mais de uma das 5 redes, ela tambm rechaada. Caso uma e apenas uma, das 5 redes da etapa de reconhecimento sinalize positivamente, afirmando que o padro de entrada conhecido por ela, as mtricas especficas dessa face so fornecidas como entrada para a segunda rede da classe que manifestou conhec-la. Essa rede ir ento associar a entrada a um de seus padres conhecidos. A

95

Figura 4.17 abaixo mostra o esquema de funcionamento do sistema de reconhecimento facial aqui proposto.

Entrada para a camada de rede de associao

Classe1 Classe2
Mtricas Faciais

Classe3 Classe4 Classe5

Sada do sistema de reconhecimento facial

Entrada para a camada de rede de reconhecimento Redes da etapa de reconhecimento

Redes da etapa de associao das entradas conhecidas aos padres da respectiva classe selecionada

FIGURA 4.17 - Esquema de funcionamento do sistema de reconhecimento facial. Como pode ser visto, atravs do esquema de funcionamento do sistema de reconhecimento, as relaes mtricas usadas como entrada da rede na etapa 1, podem no ser as mesmas usadas na etapa 2. Isto acontece, porque algumas das relaes entre as mtricas faciais, se mostraram mais propcias ao reconhecimento, na primeira etapa, em comparao associao das entradas aos padres aprendidos pela rede, na segunda etapa. Foram usados vetores de 5 posies para as redes da camada de reconhecimento e vetores de 7 posies para as redes da camada de associao. Chegou-se a esse nmero de relaes mtricas, usadas como entradas, aps a realizao de vrios testes usando as 37 faces do banco de imagens desta dissertao e avaliando os grficos de relaes entre as mtricas.

96

As medidas que apresentaram maiores discrepncias entre as faces, ou seja, aquelas que diferenciam bem uma face da outra, foram usadas nas redes da etapa 1. A Figura 4.18 mostra as medidas que mais variaram e a Figura 4.19 mostra as medidas que menos variaram.

Mtricas com Maior Variao


1,2000

1,0000

Valores normalizados

0,8000

0,6000

Ox/Oy Nx/Ny Bx/By Nx/Fx

0,4000

0,2000

100365

100525

100539

101604

104743

107147

107879

304768

912380

100160

100270

100370

100560

100636

104730

104790

Identificao das Faces

FIGURA 4.18 Relaes mtricas que mais variaram.

97

912715

12646

88643

39609

46506

50454

0,0000

Mtricas com menor Variao

1,2000

1,0000

Valores normalizados

0,8000

T2/T3 Fy/Fx T2/Fy

0,6000

T3/Fy T2/Fx T3/Fx

0,4000

0,2000

0,0000
12646 88643 39609 46506 100365 100525 100539 101604 104743 107147 107879 304768 912380 100160 100270 100370 100560 100636 104730 104790 50454 912715

Identificao das Faces

FIGURA 4.19 Relaes mtricas que menos variaram. A rede neural da camada de reconhecimento uma rede multicamadas " feedforward" com 5 entradas, 4 neurnios na camada oculta e 1 neurnio na camada de sada. Alm das 4 relaes que mais variaram, mostradas na Figura 4.18, usou-se entre outras, a relao FY/FX pois ela tambm se mostrou muito til para o discernimento entre faces por se tratar da altura e largura da prpria face. Para a rede da segunda camada foi usada uma rede multicamadas " feedforward" com 7 entradas, 6 neurnios na camada oculta e 4 neurnios na camada de sada. O algoritmo usado para o treinamento em ambas as redes foi o algoritmo de retropropagao do erro, implementado internamente no simulador neural T-LEARN. O Anexo I traz maiores informaes sobre o funcionamento e recursos apresentados pelo T-LEARN. As medidas usadas nesta etapa foram na sua maioria, as apresentadas na Figura 4.19 e ainda a relao BX/BY, que se mostrou bastante apta para realizar diferenciao entre

98

diferentes faces. BX/BY trata da relao entre a largura e a altura da boca do modelo, que pode variar significativamente de pessoa para pessoa. O prximo captulo descreve os testes realizados com o sistema de reconhecimento facial aqui proposto.

99

100

CAPTULO 5 TESTES REALIZADOS

Os testes descritos neste captulo foram elaborados com o intuito de demonstrar a viabilidade do uso do sistema hbrido inteligente aqui proposto, no reconhecimento de faces frontais. Durante os testes foram usadas faces frontais de homens e mulheres adultos, totalizando um conjunto de 37 padres divididos em 2 grupos. Um primeiro grupo de 22 faces foi utilizado, sendo subdividido em 5 classes, de acordo com o ndice facial obtido na etapa de extrao das mtricas faciais. Estas faces, em suas respectivas classes, foram usadas para treinar as redes neurais da etapa de reconhecimento e tambm da etapa de associao. As 15 faces do segundo grupo foram usadas para verificar a capacidade da rede em rejeitar faces totalmente desconhecidas. Os passos para a execuo dos testes seguiram as etapas descritas no tpico 4.2 dessa dissertao. As 22 faces usadas no treinamento ficaram distribudas dentro das 5 classes especificadas, como mostra a Tabela 5.1.

101

TABELA 5.1 - Distribuio das faces dentro das 5 classes.

Cdigo

Classe 1 FACE BAIXA

Classe 2 FACE LARGA

Classe 3 FACE MDIA

Classe 4 FACE ALTA

Classe 5 FACE ESTREITA

100365 100525 100539 101604 104743 107147 107879 12646 304768 88643 912380 100160 100270 100370 100560 100636 104730 104790 39609 46506 50454 912715
Total de Faces por Classe

x x x x X x x X x x x x x x x x x x x x x x 1 2 8 6 5

As relaes mtricas usadas como componentes dos vetores de identificao das faces nos testes so mostradas na Tabela 5.2.

102

Convencionou-se aqui, ao se referir s relaes entre largura e altura dos olhos, boca e nariz, cham- las de relaes entre componentes locais da face. As relaes entre os teros faciais, altura e largura da face so chamadas de relaes entre componentes globais da face. TABELA 5.2 Relaes mtricas usadas para representar as faces. ODX / ODY Relaes entre medidas de componentes locais. Relao entre medida de componente local e global. NX / NY BX / BY NX / FX FY / FX T2 / FY Relaes entre medidas de componentes globais. T3 / FY T2 / FX T3 / FX T2 / T3 As relaes mtricas da Tabela 5.2 foram agrupadas, formando vetores capaz de representar individualmente cada face. Algumas combinaes de componentes locais e globais se mostraram mais eficientes que outras na tarefa de representar a face de forma mpar, evitando confuses ao sinalizar se um rosto conhecido ou no. Essa capacidade fica visvel ao se avaliar o nmero de iteraes necessrias para se treinar a rede, como poder ser visto nos testes realizados no prximo tpico. As relaes mtricas usadas como componentes dos vetores de identificao das faces tambm esto descritas na Tabela 5.2. Os testes nas redes da etapa 1 e 2 ocorreram em separado. Foram realizados testes inserindo erros na aquisio das medidas, aqui representados por acrscimo de pixels nas medidas horizontais e verticais da mtricas puras, visando verificar a tolerncia das redes entradas com medidas distorcidas. Tambm foram feitos testes usando faces que no estiveram presentes na etapa de treinamento para a validao do sistema, como ser visto nos tpicos seguintes.

103

5.1. Testes Realizados na Rede da Etapa de Reconhecimento Durante os testes, procurou-se verificar quais as relaes mtricas que melhor se adaptam tarefa de sinalizar a "familiaridade" ou "no- familiaridade" de uma face humana. Para tanto foram avaliadas 8 combinaes de mtricas faciais compondo o padro de entrada da rede. A avaliao de quais as relaes mtricas mais propcias ao reconhecimento facial foi realizada usando o conjunto de faces da Classe 3, contendo 8 faces sinalizadas como "conhecidas" e ainda outras 6 faces tomadas aleatoriamente entre as demais classes representando padres "no conhecidos". A escolha da Classe 3 para a realizao dos testes foi devido ao seu maior nmero de padres, de acordo com a classificao feita pelo ndice facial. Os 8 conjuntos de relaes mtricas que compem os padres de entrada da rede da etapa 1 so mostradas na Tabela 5.3. TABELA 5.3 Grupos de relaes mtricas usados no treinamento. Grupo1: Grupo2: Grupo3: Grupo4: Grupo5: Grupo5.1: Grupo5.2: Grupo5.3: OX/OY OX/OY OX/OY OX/OY OX/OY OX/OY T3/FX BX/BY NX/NY NX/NY NX/NY NX/NY NX/NY NX/NY T2/FX NX/FX BX/BY BX/BY BX/BY BX/BY BX/BY BX/BY T3/FY T3/FY FY/FX T2/T3 NX/FX NX/FX NX/FX T2/FY T2/FY FY/FX T2/FX FY/FX FY/FX

Inicialmente, foram tomadas 3 relaes mtricas dentre quelas que apresentaram maior variao de face para face durante a anlise grfica da Figura 4.16. As 3 medidas usadas a princpio f ram OX/OY (relao entre a largura e a altura do olho direito), NX/NY o (relao entre a largura e a altura do nariz), BX/BY (relao entre a largura e a altura da

104

boca). Acredita-se, com base na anlise grfica, que usando estas relaes mtricas , a tarefa de discernimento se torne mais fcil. A seguir sero descritos os testes realizados com cada um dos grupos mostrados na Tabela 5.3.

Grupo1
Usando as 3 mtricas do Grupo1 foi possvel treinar a rede neural da etapa 1, fazendo com que a rede aprendesse a sinalizar os 8 padres pertencentes Classe 3 como sendo "conhecidos" e os 6 padres das outras classes como "no conhecidos". A curva de aprendizado mostrada na Figura 5.1.

FIGURA 5.1 Curva de aprendizado usando relaes mtricas do Grupo1. Para analisar a robustez das relaes mtricas presentes no Grupo1, foram coletadas as mesmas medidas das 15 faces do banco de imagens da Universidade de Yale. As medidas destes 15 padres no foram apresentados rede nem como exemplos de padres "conhecidos" ne m como exemplo de padres "no conhecidos". As Tabelas 5.4 e 5.5 abaixo mostram os resultados do treinamento em relao aos padres vistos durante o aprendizado e aqueles no vistos.

105

TABELA 5-4 Resposta da rede aos padres usados no treinamento (usando o Grupo1). Padro Sada desejada Classe3 1 Classe3 1 Classe3 1 Classe3 1 Classe3 1 Classe3 1 Classe3 1 Classe3 1 Estranho1 0 Estranho2 0 Estranho3 0 Estranho4 0 Estranho5 0 Estranho6 0 Sada obtida 0.990 1.000 0.984 1.000 0.955 1.000 0.997 0.987 0.000 0.018 0.045 0.018 0.006 0.006 Status OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK!

A Tabela 5.4 mostra a sada desejada definida como 1 (face conhecida) para os primeiros 8 padres pertencentes Classe3. mostrado tambm, para os 6 padres seguintes que no pertencem classe avaliada, a sada definida como 0 (face desconhecida). O limiar adotado para considerar uma sada como 1, foi definido como valores iguais ou acima de 0,5. Os valores inferiores a 0,5 so considerados 0. A quarta coluna apresenta o "Status" do reconhecimento. Como pode ser observado, a rede respondeu corretamente aos 14 padres. TABELA 5.5 Resposta da rede a padres totalmente desconhecidos (usando o Grupo1) Padro Sada desejada Estranho1 0 Estranho2 0 Estranho3 0 Estranho4 0 Estranho5 0 Estranho6 0 Estranho7 0 Estranho8 0 Estranho9 0 Estranho10 0 Estranho11 0 Estranho12 0 Estranho13 0 Estranho14 0 Estranho15 0 Sada obtida 0.631 1.000 0.997 0.996 0.000 0.718 1.000 1.000 0.202 1.000 0.000 0.000 1.000 1.000 0.000 Status ERRO! ERRO! ERRO! ERRO! OK! ERRO! ERRO! ERRO! OK! ERRO! OK! OK! ERRO! ERRO! OK!

106

A Tabela 5.5 possui a mesma estrutura e interpretao definidas para a Tabela 5.4. Avaliando-se a coluna "Status", percebe-se que a rede no consegue sinalizar corretamente para os 15 padres que no estavam presentes na etapa de treinamento. Usando o vetor formado pelos componentes do Grupo1, a rede se mostrou capaz de aprender corretamente os 14 padres vistos no treinamento, sinalizando corretamente para cada um deles. Porm a rede no possui informaes em quantidade e qualidade suficientes para sinalizar que todos os 15 padres no presentes na etapa de aprendizado so faces "no conhecidas".

Grupo2
A prxima bateria de testes foi realizada usando o Grupo2. Este grupo possui um diferencial: a relao entre a altura e a largura da face (FY / FX) que no estava presente no grupo anterior. Usando a estrutura da rede e os parmetros citados no incio deste captulo, a rede no converge at a iterao de nmero 1.000.000, como mostra a Figura 5.2a. Aps algumas tentativas, alterando-se o parmetro da taxa de aprendizado de 0.07 para 0.12, a rede converge rapidamente como mostrado na Figura 5.2b.

(A)

(B)

FIGURA 5.2 Curva de aprendizado usando relaes mtricas do Grupo2. A rede, com este novo vetor de identificao, aprende os 14 padres apresentados na etapa de treinamento e erra apenas 5 faces das 15 que no estavam presentes na etapa de treinamento.

107

Apesar da necessidade da mudan a da taxa de aprendizagem para evitar a estagnao da rede na etapa de aprendizado, fica claro que o aumento de mais uma informao no conjunto de relaes que representam a face, d maior capacidade de discernimento rede.

Grupo3 e Grupo4
Os testes usando o Grupo3 e o Grupo4 visam avaliar o potencial das outras duas relaes usadas, em comparao com a relao FY/FX (altura facial / largura facial) pertencente ao Grupo2. O resultado da comparao entre FY / FX (altura facial / largura facial), T2 / T3 (2 tero da face / 3 tero da face ) e NX / FX (largura do nariz / largura da face) est mostrado na Tabela 5.6. TABELA 5.6 Comparao entre o acrscimo de 1 relao especfica no vetor de identificao (grupo2 x grupo3 x grupo4). Tpicos avaliados Converge com erro mdio quadrtico menor que 0.02? Aprende os 14 padres apresentados no treinamento? N de erros (15 faces no presentes no treinamento). N de iteraes necessrias para atingir erro mnimo. FY/FX Sim Sim 5 235186 T2/T3 Sim Sim 4 492854 NX/FX Sim Sim 1 921321

Atravs dos resultados mostrados na Tabela 5.6, nota-se a maior eficincia do Grupo4, contendo a relao NX/FX, em diferenciar corretamente os padres que no estavam presentes no treinamento. Isso mostra que o Grupo4 possui maior capacidade de generalizao do que os apresentados pelos Grupos 2 e 3. Os parmetros usados no treinamento da rede, foram alterados apenas quando usou-se o Grupo2, a fim de evitar a estagnao da rede na etapa de aprendizado. Os demais grupos foram treinados usando os mesmos parmetros padro, descritos a seguir. Percebe-se durante a comparao dos Grupos 2, 3 e 4 que determinadas relaes mtricas tm a capacidade de tornar a rede mais apta para a tarefa de diferenciar entre padres faciais "conhe cidos e "no conhecidos". Isto pode ser visto atravs da substituio da relao T2/T3 pela relao NX/FX. S com a mudana dos parmetros,

108

o nmero de erros cometidos na avaliao das faces no presentes no treinamento foi reduzido de 4 erros para apenas 1. Usando a rede treinada com o Grupo4, que apresentou o melhor ndice de acerto at o momento, foram feitas algumas experincias variando-se o nmero de neurnios buscando uma melhor resposta em relao s faces no presentes na etapa de aprendizagem. Durante tais testes, ao aumentar o nmero de neurnios da camada escondida de 5 para 6 neurnios, o nmero de padres identificados de forma errada subiu de 1 para 2. E ao subtrairmos 1 neurnio, o nmero de erros sobe de 1 para 11 erros em 15 padres apresentados. Portanto, a estrutura proposta a seguir fica sendo, para esta dissertao, a mais adequada para o reconhecimento. Outros testes tambm foram realizados com a rede recebendo outros padres de entrada. Porm o nmero de acertos mais significativos foram atingidos com a estrutura descrita a seguir. A arquitetura final das redes da etapa 1, responsveis por sinalizar se o padro apresentado conhecido ou no a seguinte: o Nmero total de neurnios: 5; o Arquitetura: rede multicamadas de 5 entradas, 4 neurnios ocultos, 1 neurnio de sada; o Alimentao da rede: "feedforward"; o Algoritmo de aprendizado: "Retropropagao do erro". Os parmetros usados no treinamento foram: o Taxa de aprendizado usada no treinamento: 0.07; o Momentum: 0.8; o Erro Mdio Quadrtico: inferior a 0.02; o Semente inicial para os pesos: 5 . Vale ressaltar que o nmero de neurnios usados na camada oculta pode variar em caso de aumento do nmero de padres a serem aprendidos em cada classe. Assim, os 4 neurnios que para este caso so suficientes para realizar a tarefa de sinalizar se um determinado padro "conhecido" ou "no conhecido", podem ser insuficientes para

109

realizar a mesma tarefa, se a classe avaliada contiver mais de 8 padres aprendidos como "conhecidos" e 6 como "no conhecidos". Para as redes da etapa 2, responsveis pela associao do padro sinalizado como conhecido ao um padro mais parecido da classe ativa, foi definido, aps a realizao de vrios testes, a configurao tima que se segue: o Nmero total de neurnios: 10; o Arquitetura: rede multicamadas de 7 entradas, 6 neurnios ocultos, 4 neurnios de sada; o Alimentao da rede: "feedforward"; o Algoritmo de aprendizado: "Retropropagao do erro". Os parmetros usados no treinamento foram: o Taxa de aprendizado usada no treinamento: 0.07; o Momentum: 0.8; o Erro Mdio Quadrtico: inferior a 0.02; o Semente inicial para os pesos: 5. Cada uma das 5 redes independentes dessa etapa possui 4 neurnios de sada. Esta estrutura possibilita a cada uma dessas redes, mapear 16 padres de face seguindo a codificao binria (0000, 0001, 0010, etc) associada a cada padro. A capacidade total de mapeamento da estrutura de rede apresentada de 80 faces, sendo 16 faces em cada uma das 5 classes. Em casos onde o nmero de padres a serem reconhecidos ultrapasse 16 faces, ser necessrio um nmero maior de neurnios de sada alm de um aumento tambm no nmero de neurnios da camada oculta. Para o prximo teste, usando o Grupo5, foi acrescentada mais uma informao ao padro de entrada da rede. Usou-se o Grupo4 como base, para verificar se apenas a incluso de uma nova informao seria suficiente para se obter um ganho significativo no ndice de acerto da rede.

Grupo5

110

Avaliando o conjunto de mtricas pertencentes ao Grupo5, percebe-se, atravs da Figura 5.3, que a aprendizagem da rede muito rpida.

FIGURA 5.3 - Curva de aprendizagem das mtricas do Grupo5. A rede convergiu em 480544 iteraes, apresentando um erro mdio quadrtico de 0.020349. Os 14 padres foram aprendidos com sucesso pela rede, como mostra a Tabela 5.7 a seguir.

111

TABELA 5.7 - Resposta da rede aos padres usados no treinamento (usando o Grupo5). Padro Classe3 Classe3 Classe3 Classe3 Classe3 Classe3 Classe3 Classe3 Estranho Estranho Estranho Estranho Estranho Estranho Sada desejada 1 1 1 1 1 1 1 1 0 0 0 0 0 0 Sada obtida 0.984 0.981 0.990 1.000 0.981 0.966 0.983 0.990 0.000 0.017 0.007 0.023 0.044 0.000 Status OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK!

A Tabela 5.7 mostra a sinalizao correta da rede para os 8 padres pertencentes Classe3 e tambm para os 6 padres pertencentes a outras classes, sinalizados como "no conhecidos", como pode ser observado analisando a coluna "Status". Avaliando-se a sada da rede para os 15 padres no presentes na etapa de treinamento, obteve-se o seguinte resultado mostrado na Tabela 5.8:

112

TABELA 5.8 - Resposta da rede a padres totalmente desconhecidos (usando o Grupo5) Padro 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Sada esperada 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Sada obtida 0.000 0.000 0.000 0.014 0.000 0.000 0.000 0.000 0.000 0.000 0.142 0.043 0.000 0.379 0.000 Status OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! Descrio do erro

Fica claro, atravs da anlise dos resultados mostrados na Tabela 5.8, que o acrscimo da informao FY / FX (altura facial / largura facial) no vetor de identificao da face torna a representao do padro avaliado mais especfico, possibilitando um ndice de acerto maior quando so apresentados os 15 padres que no estavam presentes no treinamento. Um novo teste, a partir do Grupo5, ser realizado para se avaliar a resposta da rede a rudos durante a coleta das mtricas. A fim de simular erros durante a coleta das medidas faciais, so inseridos rudos (aqui representados pelo acrscimo de pixels) em medidas horizontais e verticais de componentes e regies da face. A Tabela 5.9 ilustra este teste. Na coluna "Pixels adicionados" informa-se em quantas unidades as medidas faciais, descritas na coluna "Medidas afetadas", esto sendo incrementadas. Aps a introduo do erro, as relaes mtricas "contaminadas" so usadas para validar a rede j

113

devidamente treinada.

Foram criados 22 tipos diferentes de contaminao nas

medidas faciais, atravs de incrementos de pixels em medidas verticais e horizontais dos padres. Estas contaminaes (erros inseridos na aquisio das medidas) foram aplicadas aos 14 padres faciais usados nesta dissertao, gerando portanto 308 novos padres (308 = 22 * 14). O nmero de erros cometidos pela rede est indicado na coluna "N de erros em 14 padres" e a coluna "Descrio do erro" informa o tipo de engano cometido pela rede. Pode-se verificar o resultado da avaliao de robustez da rede neural usando as medidas contaminas, atravs da Tabela 5.9 a seguir.

114

TABELA 5.9 - Resposta da rede a padres conhecidos acrescidos de rudo (usando o Grupo5)
Pixels adicionados

Medidas afetadas Descrio do erro Inserindo rudo em medidas verticais T2; T3; Fy T2; T3; Fy T2; T3; Fy T2; T3; Fy T2; T3; Fy Nx; Bx; Fx Nx; Bx; Fx Nx; Bx; Fx Nx; Bx; Fx Nx; Bx; Fx T2; T3; Fy; Nx; Bx; Fx T2; T3; Fy; Nx; Bx; Fx T2; T3; Fy; Nx; Bx; Fx T2; T3; Fy; Nx; Bx; Fx T2; T3; Fy; Nx; Bx; Fx T2; T3; Fy; Nx; Bx; Fx 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2
Reconheceu 1 "face no conhecida". Reconheceu 1 "face no conhecida". Reconheceu 1 "face no conhecida". Reconheceu 1 "face no conhecida". Reconheceu 1 "face no conhecida".

N de erros em 14 padres

1 pixel 2 pixels 3 pixels 4 pixels 5 pixels 1 pixel 2 pixels 3 pixels 4 pixels 5 pixels 1 pixel 2 pixels 3 pixels 4 pixels 5 pixels 10 pixels

Inserindo rudo em medidas horizontais


Reconheceu 1 "face no conhecida". Reconheceu 1 "face no conhecida". Reconheceu 1 "face no conhecida". Reconheceu 1 "face no conhecida". Reconheceu 1 "face no conhecida".

Inserindo rudo em medidas verticais e horizontais


Reconheceu 1 "face no conhecida". Reconheceu 1 "face no conhecida". Reconheceu 1 "face no conhecida". Reconheceu 1 "face no conhecida". Reconheceu 1 "face no conhecida". Reconheceu 1 "face no conhecida". No reconheceu 1 "face conhecida". Reconheceu 1 "face no conhecida". Reconheceu 1 "face no conhecida". Reconheceu 1 "face no conhecida". No reconheceu 1 "face conhecida". Reconheceu 1 "face no conhecida". Reconheceu 2 "face no conhecida". No reconheceu 3 "face conhecida". Reconheceu 1 "face no conhecida". No reconheceu 1 "face conhecida".

Adicionando os rudos aleatrios nas respectivas medidas verticais e horizontais


836248 473745 8 16 12 12 14 14 14 4 0 16 8 8 6 21 18 9 0 0 20 0 12 20 16 8

T2; T3; Fy; Nx; Bx; Fx T2; T3; Fy; Nx; Bx; Fx T2; T3; Fy; Nx; Bx; Fx T2; T3; Fy; Nx; Bx; Fx T2; T3; Fy; Nx; Bx; Fx T2; T3; Fy; Nx; Bx; Fx

1 1 2 1 5 2

115

Os testes foram separados pela insero de contaminao em medidas verticais, horizontais e medidas verticais e horizontais juntas. Foram inseridos ainda contaminaes representadas por acrscimo escolhidas aleatoriamente nas medidas informadas na coluna de "Medidas afetadas". A cada novo rudo inserido nas respectivas mtricas foram gerados 14 novos padres, sendo 8 da Classe3 e 6 padres pertencentes s outras classes. Aos 8 padres da Classe3 a rede deveria sinalizar como "conhecidos" e aos outros 6 padres, pertencentes s outras classes, a sinalizao deveria ser "no conhecidos". A rede, usando as relaes do Grupo5, cometeu 29 erros de classificao em 308 padres apresentados, totalizando um ndice mdio de acerto de 90,58%. Embora a rede tenha atingido um ndice mdio de acerto muito bom, houve vrios casos de sinalizaes positivas indevidas para faces "no conhecidas", aps a insero de rudos. A esta situao, d-se o nome de falso-positivo. Para a situao inversa, onde faces "conhecidas" so indevidamente sinalizadas como "no-conhecidas", d-se o nome de falso-negativo. Isto mostra que se esse grupo de mtricas fosse usado para controlar o acesso de pessoas a um dado local, pessoas no autorizadas conseguiriam ter acesso rea restrita. Isto aconteceria desde que um rudo ou um erro durante a aquisio das medidas faciais distorcesse, de forma favorvel ao invasor, as mtricas faciais como simulado pela contaminao das medidas (erro na aquisio das medidas). No pior caso, (onde ocorreram 2 falso-positivo s e 3 falso-negativos em 14 padres apresentados) considerando que uma distoro no momento da coleta das mtricas faciais favorecesse a falsa identificao de um estranho, este teria 14,29% de chances de entrar em um local restrito sem autorizao. Haveria tambm 21,43% de chances de um indivduo autorizado ser barrado. J para o melhor caso atingido pela rede (onde ocorreu 1 erro em 14 padres apresentados), as chances do indivduo no autorizado obter acesso caem para 7,14% usando o conjunto de mtricas do Grupo5.

116

Grupo5.1
O Grupo5.1 possui estrutura bsica similar ao Grupo5, trocando-se apenas a relao FY/FX pela relao T2/FX a fim de avaliar o desempenho da rede com uma relao mtrica que no sofresse influncia de cabelo, barba ou cavanhaque. Os resultados esto apresentados a seguir. A curva de aprendizagem usando o Grupo5.1 mostrada na Figura 5.4:

FIGURA 5.4 - Curva de aprendizagem para padres com baixa interferncia de cabelo, cavanhaque e barba. A rede convergiu em 447077 iteraes, com erro mdio quadrtico de 0.020111 e aprendendo todos os padres, como mostrado na Tabela 5.10.

117

TABELA 5.10 - Resposta da rede aos padres usados no treinamento (usando o Grupo5.1) Padro Classe3 Classe3 Classe3 Classe3 Classe3 Classe3 Classe3 Classe3 Estranho Estranho Estranho Estranho Estranho Estranho Sada desejada 1 1 1 1 1 1 1 1 0 0 0 0 0 0 Sada obtida 0.999 0.983 1.000 1.000 0.964 0.973 0.978 0.995 0.008 0.007 0.022 0.015 0.042 0.000 Status OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK!

A Tabela 5.10 mostra que todos os 14 padres foram sinalizados corretamente aps o treinamento da rede. No houve nenhum engano por parte da rede usando as relaes presentes no Grupo5.1. Para o teste com as 15 faces que no estiveram presentes na etapa de treinamento, o resultado mostrado na Tabela 5.11 abaixo:

118

TABELA 5.11 - Resposta da rede a padres totalmente desconhecidos (usando o Grupo5.1). Padro 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Sada esperada 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Sada obtida 0.000 0.000 0.000 0.013 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.113 0.000 Status OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! Descrio do erro

O Grupo 5.1 se mostrou muito bom para sinalizar como "no conhecidos", os 15 padres que no estiveram presentes na etapa de treinamento e no pertenciam Classe3, como mostra a coluna "Status" da Tabela 5.11.

119

A Tabela 5.12 apresenta os resultados obtidos usando os padres que estavam presentes na etapa de treinamento, acrescidos de rudo. TABELA 5.12 - Resposta da rede a padres conhecidos acrescidos de rudo (usando o Grupo5.1).
Pixels adicionados

Medidas afetadas

N de erros em 14 padres

Descrio do erro

Inserindo rudo em medidas horizontais 1 pixel 2 pixels 3 pixels 4 pixels 5 pixels 10 pixels
628 375 12 12 14 0 16 8 18 9 0

Nx; Bx; Fx Nx; Bx; Fx Nx; Bx; Fx Nx; Bx; Fx Nx; Bx; Fx Nx; Bx; Fx Nx; Bx; Fx Nx; Bx; Fx Nx; Bx; Fx Nx; Bx; Fx Nx; Bx; Fx

0 0 0 0 0 0 0 0 0 0 5
Reconheceu 3 "faces no conhecidas". No reconheceu 2 "faces conhecidas". Reconheceu 2 "faces no conhecidas".

Adicionando os rudos aleatrios nas respectivas medidas verticais e horizontais

12 20 8

Nx; Bx; Fx

Como os valores verticais, que eram "contaminados" com os rudos, no pertencem ao Grupo5.1, exceto a medida T2, no se avaliou a insero de rudos em relaes verticais para este grupo. Para este grupo de mtricas, o ndice mdio de acerto foi de 95,83%. No pior caso observado considerando que uma distoro no momento da coleta das mtricas faciais favorecesse a falsa identificao de um estranho, este teria 21,43% de chances de acessar um local restrito. Haveria ainda 14,29% de chances de pessoas autorizadas serem barradas.

120

Embora o ndice mdio de acerto do Grupo5.1 tenha sido melhor que o apresentado pelo Grupo5, haveria maior possibilidade de um estranho acessar indevidamente uma rea restrita, se fossem usadas as mtricas do Grupo5.1.

Grupo5.2
As relaes mtricas que compem o Grupo5.2 so formadas por regies globais da face. No h a participao de componentes locais como olhos, nariz ou boca entre os elementos presentes nestas relaes. Este grupo foi formado com a finalidade de avaliar a capacidade das medidas globais em diferenciar faces, sem a participao de componentes locais. Os resultados so mostrados a seguir. A curva de aprendizagem da rede usando o Grupo5.2 descrita na Figura 5.5 abaixo:

FIGURA 5.5 - Curva de aprendizagem das mtricas do Grupo5.2. A rede convergiu em 954106 iteraes, apresentando um erro mdio quadrtico de 0.020197. Todos os 14 padres apresentados rede foram aprendidos como mostra a Tabela 5.13 a seguir.

121

TABELA 5.13 - Resposta da rede aos padres usados no treinamento (usando o Grupo5.2) Padro Classe3 Classe3 Classe3 Classe3 Classe3 Classe3 Classe3 Classe3 Estranho Estranho Estranho Estranho Estranho Estranho Sada desejada 1 1 1 1 1 1 1 1 0 0 0 0 0 0 Sada obtida 0.996 0.979 1.000 1.000 0.957 1.000 0.986 0.999 0.001 0.043 0.000 0.000 0.026 0.010 Status OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK! OK!

A Tabela 5.14 mostra o comportamento da rede para padres no vistos no treinamento. TABELA 5.14 - Resposta da rede a padres totalmente desconhecidos (usando o Grupo5.2). Padro 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Sada esperada Sada obtida 0.000 0.000 0.000 0.000 0.000 0.854 0.000 0.594 0.000 0.000 0.000 0.000 0.000 0.007 0.000 Status Descrio do erro

OK! OK! OK! OK! OK! ERRO! Reconheceu "desconhecido" OK! ERRO! Reconheceu "desconhecido" OK! OK! OK! OK! OK! OK! OK!

122

Como pode ser observado nas Tabelas 5.13, os 14 padres foram aprendidos corretamente durante a etapa de treinamento. No h erros ao sinalizar os membros da Classe3 e os que no pertencem a esta classe, como descrito na coluna "Status". A Tabela 5.14 mostra que houve 2 falso-positivos cometidos pela rede ao identificar como "conhecidos" 2 dos 15 padres que no pertencem Classe3 e no estiveram presentes na etapa de treinamento da rede, totalizando um erro de 13,33% do total de faces analisadas. A Tabela 5.15 mostra os resultados do Grupo5.2 aplicado ao reconhecimento de faces que estiveram presentes na etapa de treinamento, mas agora se encontram "contaminadas" com rudos.

123

TABELA 5.15 - Resposta da rede a padres conhecidos acrescidos de rudo (usando o Grupo5.2).
Pixels adicionados

Medidas afetadas

N de erros em 14 padres

Descrio do erro

Inserindo rudo em medidas verticais 1 pixel T2; T3; Fy 0 2 pixels T2; T3; Fy 0 3 pixels T2; T3; Fy 0 4 pixels T2; T3; Fy 0 5 pixels T2; T3; Fy 0 Inserindo rudo em medidas horizontais 1 pixel Nx; Bx; Fx 0 2 pixels Nx; Bx; Fx 0 3 pixels Nx; Bx; Fx 0 4 pixels Nx; Bx; Fx 0 5 pixels Nx; Bx; Fx 0 Inserindo rudo em medidas verticais e horizontais 1 pixel T2; T3; Fy; Nx; Bx; Fx 0 2 pixels T2; T3; Fy; Nx; Bx; Fx 0 3 pixels T2; T3; Fy; Nx; Bx; Fx 0 4 pixels T2; T3; Fy; Nx; Bx; Fx 0 5 pixels T2; T3; Fy; Nx; Bx; Fx 0 No reconheceu 1 "face conhecida" 10 pixels T2; T3; Fy; Nx; Bx; Fx 1 Adicionando os rudos aleatrios nas respectivas medidas verticais e horizontais 836248 T2; T3; Fy; Nx; Bx; Fx 0 473745 T2; T3; Fy; Nx; Bx; Fx 0 8 16 12 12 14 14 T2; T3; Fy; Nx; Bx; Fx No reconheceu 1 "face conhecida" 3
Reconheceu 2 "faces no conhecidas". 14 4 0 16 8 8 6 21 18 9 0 0

T2; T3; Fy; Nx; Bx; Fx T2; T3; Fy; Nx; Bx; Fx

0 5

No reconheceu 3 "faces conhecidas" Reconheceu 2 "faces no conhecidas".

20 0 12 20 16 8

T2; T3; Fy; Nx; Bx; Fx

124

Este grupo de mtricas apresentou o ndice mdio de acerto igual a 97,08%. No pior caso observado, um estranho teria 14,29% de chances de acessar um local restrito, se suas mtricas fossem adulteradas favoravelmente por rudos ou erros durante a etapa de coleta de medidas. Haveria ainda 21,43% de chances de pessoas autorizadas serem barradas. Embora o ndice mdio de acerto do Grupo5.2 tenha sido o melhor, comparando com o Grupo5 e com o Grupo 5.1, sua capacidade em barrar faces aprendidas como "no conhecidas" em presena de erros durante a aquisio das mtricas se mostra igual apresentada pelo Grupo5. J a capacidade de suas mtricas em sinalizar como "no conhecidos" os 15 padres que no estiveram presentes na etapa de treinamento (e eram "no conhecidos") se mostrou inferior dos outros 2 grupos.

125

Grupo5.3
Por fim, para demonstrar indcios de que a escolha do conjunto de relaes tambm influencia na capacidade de discernimento entre as faces e no somente o nmero de entradas, foram realizados os testes com o Grupo5.3. Este grupo formado por relaes entre componentes faciais e globais. A predominncia de relaes entre regies globais da face, assim como o Grupo5.2. O que diferencia a presena de 1 relao mista (NX/FX largura no nariz pela largura da face) e 1 relao entre medidas locais (BX/BY largura pela altura da boca). Os parmetros usados para este grupo foram os mesmos usados nos testes anteriores. Os resultados so mostrados abaixo.

FIGURA 5.6 - Curva de aprendizagem das mtricas do Grupo5.3. Como pode ser visto pela curva de aprendizado mostrada na Figura 5.6, o Grupo5.3 parece no conter as relaes mtricas mais adequadas para a tarefa de reconhecimento, usando-se mesmas condies e parmetros de treinamento vlidas para os demais grupos. Percebe-se claramente que no h uma tendncia de convergncia da curva de aprendizagem da rede para os padres usando as relaes deste grupo.

126

Os ndices de acerto atingidos utilizando-se os 4 ltimos grupos em presena de rudo, esto resumidos na Tabela 5.16 a seguir. Tabela 5.16 ndice de acerto dos grupos em presena de rudos.
Grupo Erro mdio quadrtico N de iteraes N de erros Total de padres apresentados % mdia de acertos

Grupo5 0.020349 Grupo5.1 0.020111 Grupo5.2 0.020197 Grupo5.3 954106 9 308 97,08%
Rede no converge usando os mesmos parmetros dos demais grupos

480544 447077

29 7

308 168

90,58% 95,83%

Foram apresentados os 14 padres de teste para cada insero de rudos. E foram testados 22 grupos de rudos, totalizando 308 ocorrncias no caso dos Grupos 5 e 5.2. Para o Grupo 5.1 foram testados 12 grupos de rudos apenas, totalizando 168 padres apresentados rede. Os ndices de acerto atingidos para os 15 padres que no pertencem Classe 3 e no estavam na etapa de treinamento, encontram-se na Tabela 5.17. Foram comparados os 8 grupos de mtricas apresentados anteriormente na Tabela 5.3. TABELA 5.17 ndice de acerto dos 8 grupos para 15 padres desconhecidos, no presentes no treinamento.
Grupo N de erros N de padres % mdia de acertos

Grupo1 Grupo2 Grupo3 Grupo4 Grupo5 Grupo5.1 Grupo5.2 Grupo5.3

10 5 4 1 0 0 2

15 15 15 15 15 15 15

33,33% 66,67% 73,33% 93,33% 100% 100% 86,67%

Rede no converge usando os mesmos parmetros dos demais grupos

127

Os valores mostrados na Tabela 5.17 se referem s respostas apresentadas pela rede aos 15 padres "no conhecidos" e no usados na etapa de treinamento, para cada um dos 8 grupos de mtricas. Estes resultados esto ligados s Tabelas 5.5, 5.6, 5.8, 5.11, 5.14 desta dissertao. Avaliando-se os resultados dos testes, verifica-se que uma aplicao onde no se deseja permitir que pessoas no autorizadas tenham acesso a um determinado local, as mtricas dos Grupos 5 e 5.1 se mostraram mais confiveis quando comparadas s mtricas do Grupo 5.2, para este conjunto de faces utilizado nos testes. No prximo tpico sero apresentados os testes e resultados obtidos pela rede responsvel por associar faces classificadas como "conhecidas", na etapa 1, face com relaes mtricas mais prximas aprendidas durante a fase de treinamento. 5.2. Testes da Rede de Associao a Padres Conhecidos Nesta etapa avalia-se a confiabilidade da rede em mapear um conjunto de entradas em um valor previamente aprendido. Como foi descrito anteriormente no sub-tpico 4.3 desta dissertao, h 5 redes nesta segunda etapa, sendo cada uma delas responsvel por mapear padres da sua classe especfica. Os testes abaixo foram realizados usando as 5 classes obtidas do conjunto de 22 faces do banco de imagens da Aominas S.A. Aps o treinamento da rede, foram inseridos rudos nas mtricas faciais, com a finalidade avaliar o desempenho do mapeamento das faces realizado pela rede. Cada face de determinada classe foi codificada previamente em uma combinao de 4 dgitos formados por 0's e 1's. E esta codificao foi fornecida rede como sada desejada na etapa de treinamento. Na validao da rede, os 4 dgitos que codificam a face so obtidos das 4 sadas da rede desta etapa. Assim, a sada 0001 representa uma face, a sada 0010 representa outra face e assim por diante.

128

As 7 relaes mtricas que compem os padres de entrada da rede so apresentadas na Tabela 5.18. TABELA 5.18 Relaes mtricas que compem os padres de emtrada da rede da etapa2. Relaes Bx/By Nx/Fx Fy/Fx T2/Fy T3/Fy T2/Fx T3/Fx

A curva de aprendizagem para as 8 faces pertencentes Classe 3 mostrada na Figura 5.7:

FIGURA 5.7 - Curva de aprendizagem dos 8 padres da Classe 3. O erro mdio quadrtico obtido foi de 0.019988 aps 397957 iteraes. Apresentando-se novamente rede, o conjunto de padres usados durante a etapa de treinamento, percebe-se que todos os padres foram aprendidos, como mostrado na Tabela 5.19.

129

TABELA 5.19 - Resposta da rede aos padres usados no treinamento da classe 3. Padro 1 2 3 4 5 6 7 8 Sada desejada 0001 0010 0011 0100 0101 0110 0111 1000 0.000 0.000 0.000 0.000 0.000 0.007 0.000 0.992 Sada obtida 0.000 0.011 0.017 0.988 0.011 0.981 0.990 0.012 0.990 0.021 1.000 0.983 0.984 1.000 0.008 0.001 0.999 0.014 1.000 0.008 0.987 0.009 0.988 0.000 Status OK! OK! OK! OK! OK! OK! OK! OK!

A Tabela 5.19 mostra na coluna "Sada desejada" a codificao estabelecida para cada padro da Classe3. Usando-se esta codificao binria possvel representar at 16 faces para cada classe. A coluna "Sada obtida" mostra a resposta da rede aos padres usados no treinamento aps os pesos j estarem fixos. Os valores na sada da rede sero considerados 1 se forem maiores ou iguais a 0,5. Sero considerados 0 aqueles valores inferiores a 0,5. Percebe-se ento, avaliando-se a coluna "Status", que a rede aprendeu os 8 padres vistos no treinamento. A Tabela 5.20 mostra a sada da rede quando so apresentados os padres

"contaminados" com rudos.

130

TABELA 5.20 - Resposta da rede a padres conhecidos acrescidos de rudo (etapa 2 de reconhecimento).
Pixels adicionados

Medidas afetadas

N de erros em 8 padres

Descrio do erro

1 pixel 2 pixels 3 pixels 4 pixels 5 pixels 1 pixel 2 pixels 3 pixels 4 pixels 5 pixels 1 pixel 2 pixels 3 pixels 4 pixels 5 pixels 10 pixels

Inserindo rudo em medidas verticais T2; T3; Fy 0 T2; T3; Fy 0 T2; T3; Fy 0 T2; T3; Fy 0 T2; T3; Fy 0 Inserindo rudo em medidas horizontais Nx; Bx; Fx 0 Nx; Bx; Fx 0 Nx; Bx; Fx 0 Nx; Bx; Fx 0 Nx; Bx; Fx 0 Inserindo rudo em medidas verticais e horizontais T2; T3; Fy; Nx; Bx; Fx 0 T2; T3; Fy; Nx; Bx; Fx 0 T2; T3; Fy; Nx; Bx; Fx 0 T2; T3; Fy; Nx; Bx; Fx 0 T2; T3; Fy; Nx; Bx; Fx 0 No associou a entrada a nenhuma T2; T3; Fy; Nx; Bx; Fx 1 face

Adicionando os rudos aleatrios nas respectivas medidas verticais e horizontais 8 3 6 2 48 T2; T3; Fy; Nx; Bx; Fx 0 473745 T2; T3; Fy; Nx; Bx; Fx 0 8 16 12 12 14 14 T2; T3; Fy; Nx; Bx; Fx 0
14 4 0 16 8 8 6 21 18 9 0 0

T2; T3; Fy; Nx; Bx; Fx T2; T3; Fy; Nx; Bx; Fx

0 2

20 0 12 20 16 8

T2; T3; Fy; Nx; Bx; Fx

Confundiu 1 face, associando as mtricas de entrada face errada No mapeou a entrada a nenhuma face No mapeou a entrada a nenhuma face

A mdia de acertos atingida pela rede, avaliando os padres da Classe 3, foi de 97,73%.

131

A coluna "Medidas afetadas", a exemplo do que ocorre nos testes da etapa 1, mostra quais as medidas que sero contaminadas com o nmero de pixels descritos na coluna "Rudo". A coluna "N de erros em 8 padres", informa o nmero de equvocos cometidos pela rede ao classificar os 8 padres da Classe3 contaminados com os rudos. Por fim, a coluna "Descrio do erro" mostra qual o equvoco cometido pela rede na tarefa de associao (associao errada entre a face avaliada e uma das faces aprendidas ou a no associao da face avaliada a nenhuma das faces aprendidas). Os 8 padres da Classe 3 foram apresentados a cada insero de um novo conjunto de rudos. A Tabela 5.21 mostra os resultados obtidos para todas as 5 classes, seguindo o mesmo padro de testes com rudos descritos na Tabela 5.20. TABELA 5.21 - Resultados obtidos para as outras 4 classes (etapa 2 de reconhecimento). Classe N padres por Classe 1 2 8 6 5 N de erros N padres submetidos rede 22 44 176 132 110 % mdia de acertos 100 100 97,73 100 99,10

1 2 3 4 5

0 0 4 0 1

A primeira coluna da Tabela 5.21 informa qual a Classe avaliada. A coluna N Padres por Classe informa quantas faces foram enquadradas em cada Classe especfica, de acordo com o ndice facial. A coluna "N de erros" informa quantos erros ocorreram ao se introduzir os 22 tipos de erros na etapa de aquisio das mtricas faciais dos 14 padres avaliados. Esta coluna informa o nmero de erros observados em relao ao nmero total de padres submetidos rede para a dada Classe. Na coluna N de padres submetidos r de tem-se o total de padres apresentados rede em cada e

132

Classe na etapa de aquisio das mtricas, aps a contaminao com os 22 tipos de erros j mencionados. Dessa forma, a Classe 1 que continha 1 padro, aps a contaminao com 22 tipos de erros passou a ter 22 padres apresentados sua rede especfica (22 = 1 padro * 22 tipos de erros avaliados), seguindo-se o mesmo raciocnio para as demais classes. Por fim a coluna "% mdia de acerto" informa o ndice de acerto para cada Classe individualmente, avaliando os erros em relao ao total de padres apresentados para a Classe especfica. No foram feitas outras combinaes referentes s mtricas usadas para representar as faces nesta segunda etapa, pois os resultados at aqui alcanados j mostram que possvel realizar o reconhecimento de faces usando-se as relaes mtricas definidas neste trabalho. A avaliao de outros conjuntos de relaes nas 2 etapas proposta como possvel trabalho futuro, juntamente com outros testes no captulo final desta dissertao. O prximo tpico dedicado aos comentrios a respeito dos testes realizados.

5.3.

Discusso Sobre os Testes Realizados

O foco desta dissertao foi a utilizao de mtricas faciais para o reconhecimento de faces. Buscou-se mostrar a viabilidade do uso dessas medidas para reconhecer um rosto. Os estudos vistos durante o desenvolvimento desta dissertao sobre reconhecimento facial usam poucos recursos geomtricos para a tarefa de reconhecimento, por acreditar que as medidas de componentes faciais, por si s, so incapazes de efetuar o discernimento eficiente entre faces distintas. Os resultados atingidos, apresentados nos tpicos 5.1 e 5.2 desta dissertao, mostram que uma vez escolhidas as mtricas faciais e relaes proporcionais adequadas e usando-se a capacidade de generalizao das redes neurais, possvel a diferenciao entre rostos "conhecidos" e "no conhecidos", atravs de um sistema que combine caractersticas geomtricas de representao facial e caractersticas presentes em redes

133

neurais artificiais, como o proposto por este trabalho. Tal sistema tambm se mostra apto para mapear uma face apresentada na entrada da rede, na face mais semelhante aprendida na fase de treinamento. Desta forma, o sistema aqui proposto pode certamente ser usado como ferramenta de reconhecimento ou como apoio a outros sistemas baseados em metodologias diferentes como lgebra linear, modelos deformveis e filtros baseados em wavelets, a fim de se atingir um bom ndice de acerto no reconhecimento facial. No prximo tpico sero descritos alguns comentrios sobre detalhes do uso das mtricas faciais no reconhecimento facial. 5.3.1. As Mtricas Usadas para Representao Facial A imagem contendo uma face a informao bsica que deve ser trabalhada por um sistema de reconhecimento automtico de faces. As representaes mais usuais em sistemas desse tipo so feitas atravs de matriz de pixels (informaes de iluminao), modelos tridimensionais ou at mesmo por uma mistura das duas formas (Oliveira, 1997). A partir da imagem de entrada devem ser extradas caractersticas para a representao do rosto de forma manipulvel pelo sistema de reconhecimento. A extrao dessas caractersticas pode ser feita de 2 formas: implcita ou explcita (Oliveira, 1997). A extrao implcita utilizada por todos os mtodos que fazem uso de algoritmos de categorizao implcitos ou que usem propriedades da imagem para gerar representaes sem se basear em informaes locais de componentes. J a extrao explcita compreende os mtodos que partem de caractersticas previamente estabelecidas, tais como medidas entre pontos-chaves utilizados pelos mtodos geomtricos. A extrao explcita de caractersticas foi o mtodo adotado por esta dissertao, buscando o embasamento na anatomia facial para a determinao das relaes mtricas que representam individualmente cada face.

134

Atravs da extrao explcita de caractersticas visou-se determinar quais dos componentes e reas da face eram realmente importantes para o discernimento facial. Os componentes dos vetores, usados para representar a face durante as 2 etapas de reconhecimento, foram escolhidos levando-se em considerao as dificuldades encontradas em se mensurar tais regies. Algumas reas e componentes da face se mostraram muito suscetveis a variaes do tipo: corte de cabelo ou presena de barba, bigode e cavanhaque. Foi observado que determinados cortes de cabelo impediam a determinao correta do 1 tero facial, pois a franja obstrua a determinao da linha da raiz do cabelo, como mostrado na Figura 5.8.A. A determinao do 1 tero da face tambm se mostrou imprecisa em casos onde o modelo calvo, ilustrado na Figura 5.8.B.

(A)

(B)

FIGURA 5.8 - Dificuldades de determinao do primeiro tero da face. (A) Linha da raiz do cabelo ocultada pela franja. (B) Encontra-se a dificuldade de determinar o ponto de incio da linha da raiz do cabelo. Outro problema encontrado foi a determinao da linha tangente regio mentoniana, usada na determinao do 3 tero e da altura facial. Neste caso, ilustrado na Figura 5.9, a dificuldade causada pelo uso de barba ou cavanhaque que cobre e prolonga o queixo, impedindo-se a determinao da linha tangente a esta regio.

135

FIGURA 5.9 - Dificuldade de localizao da regio mentoniana, usada na determinao da altura da face e do 3 tero facial. Atravs destas observaes, optou-se por no utilizar as medidas extradas do 1 tero da face. Para o caso da altura facial, assumiu- se que a linha deveria ser tangente ao final da face. Caso houvesse a presena de barba ou cavanhaque, a linha seria tangente ao final desse adorno. No foi possvel descartar esta regio pois ela usada na determinao da altura facial, sendo uma das medidas necessrias determinao do ndice facial. Determinadas mtricas apresentaram maior adaptabilidade que outras, quando avaliado o seu desempenho nas 2 etapas que compem o reconhecimento facial aqui descrito. A principal estratgia usada neste trabalho foi a classificao de faces com formatos variados em grupos com caractersticas bsicas semelhantes, atravs da determinao do ndice facial. Dessa forma, no foram feitas comparaes entre faces totalmente diferentes ("faces baixas" comparadas a "faces estreitas" por exemplo) usando os componentes apropriados para a tarefa de ajuste fino, como algumas das relaes mtricas usadas nesta dissertao (ODX/ODY, NX/NY, NX/FX, entre outras). As redes no convergiam em testes realizados antes dessa classificao pois um conjunto de caractersticas prprias de uma face sofria interferncia do conjunto de caractersticas do outro tipo de face. Os ajustes feitos nos pesos da rede, para atender ao reconhecimento de faces de uma dada classe, no eram os mesmos ajustes necessrios para o reconhecimento de outra classe distinta. Por isso a rede no aprendia os padres. Isso mostra que em certas situaes, os detalhes ou certas particularidades dos componentes faciais so um diferencial importante na tarefa de discernimento entre uma

136

face "conhecida" e o "no conhecida". Porm uma pr-seleo de grupos de faces com caractersticas gerais similares deve ser feita antes do treinamento para um melhor aprendizado. A seguir sero feitas algumas observaes sobre a rede neural usada no sistema de reconhecimento facial. 5.3.2. Mtodo Conexionista No-Linear Usado Segundo (Haykin, 2001) o poder de generalizao de uma rede neural est diretamente relacionado com a sua estrutura maciamente paralela e distribuda. A generalizao se refere ao fato da rede produzir sadas adequadas para entradas que no estavam presentes durante o treinamento. a chamada "aprendizagem". A generalizao uma das principais caractersticas que tornam as redes neurais aptas tarefa de reconhecimento facial. Esta caracterstica pde ser percebida durante os testes, como mostram os resultados apresentados nas Tabelas 5.5, 5.6, 5.8, 5.11 e 5.14. Durante toda a fase de testes a estrutura da rede foi alterada na busca de uma configurao que atendesse tarefa de reconhecimento. A capacidade de adaptao das redes tambm foi testada alterando-se os parmetros de aprendizagem, experimentandose novas combinaes de mtricas faciais, novos erros mnimos aceitveis, degradandose a estrutura da rede para verificar a interferncia causada nos resultados, entre outros experimentos. A boa tolerncia a falhas apresentada pelas redes neurais tambm foi alvo de testes realizados neste trabalho. Esta caracterstica pde ser avaliada durante os testes de tolerncia a falhas, no processo de aquisio de dados, como mostram especificamente os resultados das Tabelas 5.9, 5.12, 5.15, 5.20 e 5.21. Nestes testes, variou-se de forma controlada os valores das mtricas de componentes da face, observando-se at quando, com o aumento dos nveis de rudo, a rede ainda conseguiria obter a resposta correta nos neurnios de sada.

137

Foi observado que o desempenho da rede degrada suavemente sob condies de operao adversas. Devido natureza distribuda da informao armazenada na rede (Haykin, 2001), o dano que por ventura venha a ser causado em sua estrutura deve ser extenso para que a resposta global seja degradada seriamente. O papel da rede neural neste sistema foi substituir as comparaes entre padres de faces utilizando algoritmos de classificao numrica, por um sistema inteligente capaz de lidar com pequenos erros e presena de rudos, realizando ainda assim, um reconhecimento eficiente. Os testes realizados comprovaram que as redes neurais so uma boa ferramenta para tratar a inexatido e variabilidade dos padres faciais. Atravs do uso das redes neurais, pequenas variaes de expresso observadas na face do modelo podem ser desconsideradas no momento de verificar se uma face conhecida ou no. Esta informao adulterada no impede a realizao do reconhecimento facial correto, como foi visto nos testes com insero de rudos. A configurao final da rede, capaz de realizar o reconhecimento nas etapas 1 e 2, foi atingida aps uma srie de testes envolvendo vrias combinaes de mtricas representando as faces. Na etapa 1, apenas 1 neurnio na camada de sada suficiente para informar se o padro facial de entrada conhecido ou no. J o nmero de neurnios da camada oculta deve ser alterado para casos onde o nmero de faces seja superior aos 14 padres usados aqui. Sugere-se um aumento gradativo de neurnios na camada escondida, bem como de relaes mtricas (na composio do vetor de identificao) que garantam a unicidade de cada face a fim de que a rede continue com um bom ndice de acerto. Na etapa 2, foram usados 4 neurnios de sada, o que torna cada rede capaz de representar at 16 faces. Em casos onde o nmero de faces por classe for maior que 16, o nmero de neurnios da camada oculta, os nmero de neurnios da camada de sada, bem como o nmero de elementos que representem a face, devem ser alterados. Novos neurnios devem ser adicionados rede (e novas relaes mtricas acrescentadas ao vetor de identificao das faces), na medida em que sejam aumentados o nmero de faces de cada classe e o desempenho da rede comece a cair.

138

O aumento no nmero de neurnio se justifica pelo fato da rede ter a necessidade de armazenar informaes das novas faces, distribudas nos pesos dos novos neurnios. A necessidade de novas informaes para representar um nmero maior de faces justificada pelo fato da rede precisar de novos critrios de desempate para realizar o reconhecimento facial. A seguir sero comentados os resultados obtidos nos testes. 5.4. Resultados Obtidos Os ndices de reconhecimento obtidos durante a fase de testes e apresentados nas Tabelas 5.16 e 5.17 mostram que o uso de mtricas faciais aplicadas ao reconhecimento facial vivel para pequenos grupos de faces. Utilizando-se apenas um conjunto de 13 medidas (apresentadas nas Tabelas 4.2 e 4.3 ) extradas de fotos frontais e estabelecendo as relaes proporcionais entre tais medidas (mostradas nas Tabelas 4.4A e 4.4B), foi possvel diferenciar entre faces "conhecidas" e "no conhecidas". Tambm foi possvel associar ao vetor de mtricas faciais na entrada da rede, a codificao da face que mais se assemelhou a esse vetor dentro do conjunto de padres vistos na fase de aprendizado. Foram obtidas mdias de acerto acima de 95% nas redes da etapa 1 (mostradas nas Tabelas 5.6 e 5.16), para padres vistos na fase de treinamento acrescidos de rudos. Tambm nesta etapa foram alcanados ndices de acerto superiores a 85%, quando apresentados padres que no estavam presentes na fase de treinamento (mostrado na Tabela 5.17). Para as redes da etapa 2 de reconhecimento, os acertos foram superiores a 97% (conforme as Tabelas 5.20 e 5.21). As variaes nos ndices de acerto se devem ao uso de um vetor contendo um grupo com relaes mtricas mais ou menos aptas para discernir entre as vrias faces avaliadas. Os resultados obtidos reforam a idia de que a definio de um vetor de caractersticas baseado em pontos chaves da face (como os pontos craniomtricos ou mesmo outros

139

pontos anatmicos usados em odontologia e reconstituio facial) robusto o suficiente para ser aplicado ao reconhecimento de faces, dentro de um grupo limitado de pessoas. Um ponto importante observado nos testes refere-se estratificao das faces a serem reconhecidas dentro de grupos com caractersticas semelhantes. Esta estratificao deve ser realizada para que sejam comparadas, usando as relaes mtricas de ajuste fino mostradas nesta dissertao, somente aquelas faces com as mesmas caractersticas globais. Assim tem-se um aprendizado rpido das caractersticas das faces de cada grupo. Fica claro ainda que deve-se escolher bem os componentes faciais para se extrair as mtricas e definir apropriadamente as relaes entre elas. Dessa forma assegura-se uma boa representao das particularidades de cada face, tornando o discernimento entre estes padres mais fcil. 5.4.1. Comparao entre ndices de Reconhecimento Segundo (Oliveira, 1997), os estudos realizados por (Bledsoe, 1966), (Goldestein et al.1971), (Kanade, 1973), (Brunelli e Poggio, 1991) utilizando mtodos geomtricos aplicados ao reconhecimento facial obtive ram ndices de acerto que variaram enter 45 e 90% de acerto. Alguns desses estudos usavam marcaes feitas mo em fotos de faces frontais, indicando os cantos dos olhos, boca, nariz e queixo, como as realizadas nesta dissertao. Porm no era levado em considerao as caractersticas dos pontos craniomtricos e as relaes lineares existentes entre estes pontos. As comparaes entre as medidas que representavam as faces (determinando se um vetor de medidas caractersticas pertencia ou no a uma determinada face) eram realizadas por algoritmos de classificao numrica. Os ndices de reconhecimento obtidos nesta dissertao (acima de 90%), apresentam um forte indcio de que o uso de um conhecimento prvio sobre a anatomia facial, levando em considerao suas particularidades na escolha das mtricas para representar a face,

140

so um ponto importante para se realizar um reconhecimento eficiente. Outro ponto a ser considerado o uso de redes neurais em substituio dos algoritmos de classificao numrica. A travs do uso das redes neurais, pode-se trabalhar melhor a imperfeio ocorrida na coleta das mtricas. No se est afirmando aqui que o sistema hbrido proposto nesta dissertao melhor ou pior do que os descritos em trabalhos anteriores. Esta afirmao no poderia ser feita uma vez que os testes no foram realizados usando-se o mesmo nmero de padres, as mesmas faces, sob as mesmas condies de iluminao e resoluo. O que se quer mostrar que o uso de uma heurstica na determinao dos pontos a serem medidos na face e a aplicao de mtodos inteligentes na comparao dessas medidas, geram bons ndices de acerto no reconhecimento facial, como podem ser visto se comparados apenas os ndices de reconhecimento dos testes aqui apresentados com os ndices vistos em outros trabalhos. O prximo tpico apresenta possveis aplicaes para este trabalho. 5.5. Aplicabilidade do Trabalho Avaliando-se os resultados desta dissertao, conclui- se que vivel a implementao de um sistema hbrido de reconhecimento automtico de faces, se o mesmo for guiado pela aplicao que se deseja. Se a aplicao desejada for um sistema de controle de acesso, usando o reconhecimento da faces, espera-se colaborao daqueles que vo utilizar tal sistema. Portanto preocupaes do tipo: posicionamento da face de forma correta em frente a cmera de aquisio de imagens, expresso facial neutra apresentada pelo usurio no momento da validao do acesso, presena ou ausncia de adornos como culos por exemplo, no representam grandes problemas pois os usurios estaro cientes das exigncias para o perfeito funcionamento do sistema. Assim, as faces dificilmente estaro em uma posio diferente da esperada, estando ainda a uma distncia conhecida da cmera.

141

O ambiente de aquisio das imagens perfeitamente controlvel, no que se refere a luminosidade, ou presena de objetos que possam ocultar partes de interesse da face a ser analisada. Como o nmero de pessoas que ter acesso a um determinado local no deve ser muito grande, um sistema com as caractersticas do sistema hbrido apresentado nesta dissertao, atenderia s necessidades exigidas para o controle de acesso a determinados ambientes. Para o caso de reconhecimento de faces de criminosos, dentro de uma banco de fotos, as caractersticas referentes ao posicionamento frontal da face, controle de iluminao e "background" tambm atenderiam s necessidades de funcionamento do sistema hbrido. Porm o grande nmero de faces presentes em um banco de fotos policial, geralmente em torno de milhares, pode ser um elemento que dificultaria o reconhecimento. A melhor estratgia para este caso, seria uma estratificao das faces em nmero maior de classes que o apresentado nesta dissertao. Dessa forma, diminuir-se- ia o nmero de elementos presentes em cada classe de faces. Para o caso onde a rede no consiga determinar exatamente a face procurada, ela poder apontar a face que mais se assemelha ao objetivo, segundo as mtricas avaliadas. Alm das aplicaes citadas acima, que podem ser satisfeitas pelo sistema hbrido, ainda possvel utiliz- lo como apoio para outros sistemas de reconhecimento facial, fazendo com que ele gere um parecer paralelo e depois se compare os dois resultados obtidos. Em caso de duplo positivo, isto , ambos os sistemas reconheceram a face, uma dada ao poderia ser executada. Caso pelo menos um dos sistemas apresentasse resposta divergente, uma nova verificao poderia ser exigida, ou ento uma interveno humana solicitada. E em caso de duplo negativo, a ao correspondente ao "no reconhecimento" seria disparada. O sistema aqui proposto pode ainda ser adaptado para determinao de sexo, raa, auxlio em anlises faciais buscando por problemas de assimetria facial, auxlio a ortodontia entre outras aplicaes.

142

CAPTULO 6 CONCLUSES E PERSPECTIVAS PARA TRABALHOS FUTUROS

Esta dissertao apresenta um prottipo de avaliao para a construo de um sistema hbrido inteligente, direcionado ao reconhecimento de faces. Tal sistema procura mesclar as caractersticas locais e globais da face, usadas nos mtodos geomtricos, com a capacidade de generalizao e robustez falhas, observadas nos mtodos inteligentes baseados em redes neurais artificiais. A aplicao dos mtodos geomtricos ao reconhecimento facial teve incio na dcada de 60. Eram usadas medidas de componentes e regies da face, coletadas manualmente, para formar um vetor de medidas caractersticas que representaria cada padro de forma nica. A escolha das caractersticas a serem medidas era feita de forma subjetiva, no havendo nenhuma explicao lgica ou embasamento terico para escolher este ou aquele componente facial. Alm disso, a comparao feita entre dois vetores, verificando se tais representaes faziam referncia mesma face, era feita atravs de algoritmos de classificao numrica. Esta forma de comparao era altamente suscetvel a variaes causadas por rudos ou por impercia no momento da coleta de medidas. Buscou-se neste trabalho, levantar embasamentos cientficos para auxiliar na escolha dos componentes a serem examinados na face. Observou-se tambm, quais medidas deveriam ser consideradas para se realizar o reconhecimento facial. Estudos foram realizados sobre a morfologia da face humana, buscando encontrar pontos de referncia que justificassem a escolha deste ou daquele componente, para se extrair as medidas responsveis por representar uma face de forma nica. Os fundamentos seguidos aqui para determinar os pontos de referncia, componentes e medidas faciais relevantes para o reconhecimento de faces foram encontrados em estudos anatmicos da rea de ortodontia, fonoaudiologia e reconstituio maxilo- facial.

143

Avaliando-se as referncias destas cincias, descobriu-se que as faces podem ser estratificadas em classes, de acordo com a determinao do seu ndice facial. Este ndice, que composto pela razo entre a altura facial e a distncia bizigomtica, pode ser determinado sem dificuldades e de forma satisfatoriamente precisa em fotos de faces frontais. Ainda nos estudos realizados sobre a anatomia facial, foram encontrados pontos de referncia sobre o esqueleto da face (denominados pontos craniomtricos) e relaes entre estes pontos (denominadas medidas lineares). Estas relaes so usadas por profissionais de ortodontia e reconstituio maxilo- facial em exames, tratamentos e cirurgias corretivas. O uso destes pontos de referncia durante os testes aqui realizados, bem como o uso das medidas lineares estabelecidas entre eles, mostrou-se eficiente na formao de vetores capazes de representar faces de forma nica, possibilitando assim o seu reconhecimento. Aps este estudo, um dos problemas apontados originalmente para o uso dos mtodos geomtricos (subjetividade na determinao de quais medidas devem ser usadas para representar uma face) pde ser resolvido. Adotou-se como referncia, para a determinao das medidas caractersticas de uma face, o uso dos pontos craniomtricos e das medidas lineares existentes entre eles. Todos os pontos de referncia usados aqui esto presentes em todas as faces humanas e so possveis de serem determinados sem maiores problemas. O segundo problema, apontado em estudos anteriores sobre os mtodos geomtricos, foi a vulnerabilidade a rudos. Originalmente os mtodos geomtricos usavam algoritmos de classificao numrica para a comparao entre 2 vetores, a fim de determinar se ambos eram referentes mesma face. Foi proposto nesta dissertao a substituio desses algoritmos por mtodos baseados em inteligncia computacional. Para tornar a tarefa de reconhecimento facial mais simples, este trabalho usou a estratgia "dividir para conquistar". Tal estratgia prega a quebra de problemas grandes e de difcil soluo, em problemas menores que apresentem solues mais simplificadas.

144

Optou-se ento por quebrar a tarefa de reconhecimento facial em 2 tarefas menores. A primeira tarefa verificar se uma determinada face conhecida. Em caso positivo inicia-se segunda tarefa, que a procura (dentro do grupo de faces vistas na etapa de treinamento) daquela face que mais se assemelha ao padro analisado no momento. Foram usadas redes neurais multicamadas, alimentadas adiante e treinadas por retropropagao do erro, a fim de verificar se um padro era conhecido ou no (etapa 1). Usou-se tambm (etapa 2) outra rede com as mesmas caractersticas estruturais, um nmero maior de entradas e de neurnios escondidos, para avaliar a similaridade entre os padres vistos na etapa de treinamento e o padro avaliado naquele momento. Cada uma das cinco classes de faces possui um par dedicado de redes (uma para a etapa 1 e outra para a etapa 2). O uso da estratgia se mostrou eficaz pois foram obtidos bons ndices de acerto no reconhecimento facial. A estratificao das faces em diferentes classes contendo padres com caractersticas semelhantes, antes de apresent-las s redes neurais, foi importante para otimizar o aprendizado dessas redes. Foi observado, durante a etapa de testes, que antes de usar a estratificao em classes, um determinado nmero de faces era aprendido pela rede sem maiores problemas. Alterando-se os padres para um segundo grupo, com o mesmo nmero de elementos, a rede apresentava dificuldades em aprend- los. Mais tarde, descobriu-se que essa dificuldade estava diretamente ligada s caractersticas de faces pertencentes a classes extremas. Durante a etapa de treinamento, os ajustes feitos para satisfazer o aprendizado de um determinado padro de uma classe entravam em contradio com os ajustes nos pesos para atender o padro da outra classe. Esta situao levava a rede a no convergncia. Analisando os testes realizados, pode-se perceber que o emprego de um sistema hbrido que combina caractersticas de mtodos geomtricos e caractersticas de inteligncia computacional, perfeitamente vivel para a tarefa de reconhecimento facial. Foram alcanados ndices de acerto acima de 95% para as redes da etapa 1, avaliando-se padres vistos na fase de treinamento acrescidos de rudos. E foram alcanados ndices de acerto superiores a 85%, quando apresentados padres que no estava m presentes na

145

fase de treinamento. As redes da etapa 2 de reconhecimento obtiveram acertos superiores a 97%. Observou-se durante os testes a influncia sofrida por algumas regies da face a variaes estticas como cortes de cabelo, presena ou ausncia de barba, bigode e cavanhaque. As regies mais afetadas por estas variaes foram as relaes faciais que envolviam o 1 tero facial (T1), o 3 tero facial (T3) e a altura da face (FY). Em presena de certos adornos (barba e cavanhaque) ou penteados (com franjas cobrindo a testa) percebeu-se uma grande dificuldade para a determinao exata dessas medidas, principalmente na determinao de T1. Foram feitos testes sem o uso de relaes mtricas que contivessem essas 3 medidas, e foi possvel realizar o reconhecimento da etapa1 sem problemas. A medida FY foi usada apenas para a determinao do ndice facial, no caso desse teste. No decorrer dos testes foi possvel tambm perceber que a etapa que deve ser tratada com mais cuidado a etapa 1. Nela devem ser u sadas as relaes que apresentaram maior poder de diferenciao entre faces, a fim de garantir uma sinalizao precisa sobre a face ser "conhecida" ou "no-conhecida". O estudo do poder de discernimento de uma relao mtrica entre duas medidas pode ser feita atravs de uma avaliao grfica, como foi mostrado no captulo 4 desta dissertao. Atravs da variao apresentada por uma relao mtrica entre uma face e outra, pode-se ter a noo se ela tem um alto poder de diferenciao (quando h oscilao significativa de face para face) ou no (quando a trajetria da linha permanecer aproximadamente constante variando-se de face para face). Avaliando-se a etapa 2 do reconhecimento, observa-se que ela funciona como um ajuste fino para encontrar um determinado padro dentro de um conjunto de padres com caractersticas prximas. Como as caractersticas no so exatamente as mesmas, a tarefa de mapeamento de um padro em um dos outros padres do conjunto no se mostra muito complexa para um nmero no muito grande de elementos. Para um

146

nmero maior de elementos do conjunto a idia de no complexidade se mantm, desde que existam variaes suficientes entre os valores que compem os padres. Deve-se estar atendo ao nmero de entradas a serem usadas para representar cada face na etapa 2. Pode-se conseguir um bom ndice de acerto usando um nmero pequeno de entradas, mas a robustez a rudos pode ficar comprometida com a reduo dos padres de desempate. Ainda com relao composio dos vetores que representam as faces, o uso das relaes mtricas entre medidas de componentes e regies da face, ao invs do uso das medidas puras, se mostrou muito til para eliminar variaes que podem existir entre a distncia da face e da cmera no momento da foto. Alm disso, cria-se a oportunidade de aumentar o nmero de possveis componentes do vetor que representa a face. Por fim, podem ser citados como contribuio oferecida por este trabalho os seguintes tpicos: Uso de pontos de referncia anatmicos e suas relaes na criao de uma representao facial aplicvel tarefa de reconhecimento; Avaliao na substituio de algoritmos numricos por mtodos inteligentes na tarefa de comparao entre vetores contendo mtricas faciais; Avaliao da estratificao de um conjunto de faces em classes menores antes de iniciar as etapas de treinamento e tambm na etapa do reconhecimento facial propriamente dito; Avaliao e alertas sobre regies da face que devem ser evitadas, dentro do possvel, para se representar uma face (devido a suscetibilidade a variaes estticas);

147

Os artigos publicados durante a confeco deste trabalho esto citados nas referncias bibliogrficas (Oliveira e Guimares, 2001a) e (Oliveira e Guimares, 2001b).

Perspectivas para trabalhos futuros


Inicialmente deve-se realizar um estudo das melhorias que seriam agregadas ao sistema, se juntamente com as fotos frontais fossem analisadas tambm as fotos perfiladas dos modelos. De posse dessas informaes, seria possvel tambm fazer uso de outras distncias e ngulos f ciais usados pela ortodontia, aplicando-as ao reconhecimento a facial. Dessa forma o sistema hbrido poderia se tornar mais robusto a falhas. Ainda com relao s mtricas faciais, novas combinaes poderiam ser testadas na etapa 2. Deseja-se assim verificar outras medidas que tambm se mostrem aptas ao "ajuste fino" do reconhecimento facial feito por esta etapa. Alm desse estudo, outro ponto a ser desenvolvido a extrao automtica das mtricas faciais. Dessa forma, seria possvel ter a certeza que nenhum conhecimento implcito ao operador que extrai as mtricas est sendo usado na coleta. Uma sugesto para essa extrao automtica a diviso da tela em regies onde espera-se que estejam presentes os componentes a serem medidos. A partir dessa diviso, seguida de seguimentaes e filtragens em cada uma das regies definidas a fim de realar as caractersticas desejadas, seriam determinados os pontos de interesse e as respectivas medidas entre eles.

148

REFERNCIAS BIBLIOGRFICAS

Adhiwiyogo, M., Chong, S., Huang, J., Teo, W.. Fingerprint Recognition [on line] http://www.andrew.cmu.edu/~jchuang/551/final/fnalreport.html, 1999. Angelo, N. P., Haertel, V.. Avaliao dos Parmetros dos Filtros de Gabor na

Classificao Supervisionada de Imagens Digitais, Re vista de Informtica Terica e Aplicada, vol. 9, no 1, Ago. 2002. Bartlett, M., Hager, J., Ekman, P., Sejnowski, T.. Measuring facial expressions by computer analysis. Psychophysiology, 36:253-264, 1999. Ben-Yacoub, S., Fasel, B., Luttin, J.. Fast face detection using MLP and FFT. In Second International Conference on Audio and Video-Based Biometric Person Authentication, p. 31-35, 1999. Bianchini, E. M. G.. Articulao Temporomandibular Implicaes, Limitaes e Possibilidades Fonoaudiolgicas, 1 ed, Pr-fono Departamento Editorial. 401 pg., 2000. Black, M. J., Yacoob, Y.. Tracking and recognizing rigid and non-rigid motions using local parametric models of image motion. In Proc. Of International conference on Computer Vision, pg. 374-381, 1995. Bledsoe, W. W.. Man- machine facial recognition. Relatrio tcnico, Panoramic Research Inc., Palo Alto, CA, 1966. Bouattour, H., Souli, F. F., Viennet, E.. Neural nets for human face recognition. IJCNN92, III:700-704, 1992. Bruce, V., Burton, A. M., Hanna, E., Healey, P., Mason, O.. Sex discrimination: how do we tell the difference between male and female faces. Perception, 22:131-152, 1993.

149

Bruce, V., Humphreys, G. W.. Recognizing objects and faces. Visual Cognition, pg. 141-180,1994. Brunelli, R., Poggio, T.. Face recognition: Features versus templates. Relatrio tcnico, I.R.S.T., 1991. Burton, A. M., Bruce, V., Dench, N.. What's the difference between men and women? Evidence from facial measurement. Perception, 22:153-176, 1993. Carpenter, G. A., Grossberg, S.. A massively parallel architecture for a self organizing neural pattern recognition machine. Comput. Vision Graphics Image Process. 37:54115, 1987a. Carpenter, G. A., Grossberg, S.. ART2: Self-organization of stable category recognition codes for analog input patterns. Appl. Opt. 26:4919-4930, 1987b. Carpenter, G. A., Grossberg, S.. The ART of adaptative pattern recognition by a selforganization neural network. Computer 21(3):77-88, 1988. Carpenter, G. A., Grossberg, S.. ART3: Hierarchical search using chemicla transmitters in self-organizing pattern recognition architectures. Neural Networks 3(2):129-152, 1990. Chan, H., Bledsoe, W. W.. A man-machine facial recognition: some preliminary results. Relatrio tcnico, Panoramic Research Inc., Palo Alto, CA, 1965. Chiche, G. I., Pinault, A.. Princpios Cientficos e Artsticos aplicados Odontologia Esttica, 1 ed, Quintessence Books. 201 pg., 1996. Cohn, J. F., Zlochower, A. J., Lien, J., Kanade, T.. Automated face analysis by feature point tracking has high concurrent validity with manual facs coding.

Psychophysiology, 36:35-43, 1999 Cottrell, G. W., Munro, P.. Principal component analysis of images via backpropagation. Proc. Soc. of Photo-Optical Instr. Eng., 1988.

150

Daugman, J. G.. Complete Discrete 2-D Gabor Transforms by Neural Networks for Image Analysis and Compression, IEEE Trans. on Acoustics, Speech, and Signal Processing, vol. 36, no. 7, Jul. 1988. DE Almeida, R. C., DE Almeida, M. H. C.. A Assimetria Facial no Exame Clnico Frontal da Face, Revis ta da Sociedade Paulista de Ortodontia Revista Ortodontia, vol. 32, no. 2, pp.82 86, 1999. DE Felcio, C. M.. Fonoaudiologia Aplicada a Casos Odontolgicos Motricidade Oral e Audiologia, 1 ed, Pancast Editora Com. e Representaes LTDA. 243 pg., 1999. Donato, G., Bartle, M. S., Hager, J. C., Ekman, P., Sejnowski, T.. Classifying facial actions. IEEE Trasaction on Pattern Analysis and Machine Intelligence, 21(10):974989, Oct 1999. Epker, B. N., Fish, L.. Evaluation and Treatment Planning. Dentofacial Deformities . v. 1, p. 9, 1986. Fu, K. S., Gonzales, R., Lee, C.. Robotics: Control, Sensing, Vision and Intelligence. McGraw-Hill, 1987. Fukui, K., Yamaguchi, O.. Facial feature point extraction method based on combination of shape extraction and pattern machine. System and Computers in Japan, 29(6):4958, 1998. Goldstein, H., Lesk.. Identification of human faces. Proceedings IEEE, 59:748, 1971. Gonzalez, R. C., Winitz, P.. Digital Image Processing. Addison- Wesley Publishing Company, 1992. Graziani, M.. Cirurgia Buco-Maxilo-Facial, 7 ed., Guanabara Koogan, 717 pg., 1986. Han, C. C., Liao, H. Y. M. G., Yu, K. C., Chen, L. H.. Fast face detection via morphologybased pre-processing. Taipei / Taiwan: Academia Sinica, 1997. 21p. (TR-IIS-97-001).

151

Haykin, S.. Redes Neurais princpios e prtica, 2 ed., Brookman, 900 pg., 2001. Hertz, J., Krogh, A., Palmer, R. G.. Introduction to the Theory of Neural Computation, volume 1 de Computation and neural system series. Allan M. Wylde, 1991. Kalocsai, P. Malsburg, C. von der and Horn, J.. Face recognition by statistical analysis of feature detectors. Image And Vision Computing, 18(4):273-278, March 2000. Kanade, T.. Picture Processing System by Computer Complex and Recognition of Human Faces. Tese de Doutorado, Dept. of Information Science, Kyoto University, 1973. Lades, M., Vorbruggen, J.C., Buhmann, J., Lange, J., Malsburg, C. v. d., Wurtz, R. P., Konen, W.. Distortion Invariant Object Recognition in the Dynamik Link

Architecture. IEEE Transactions on Computers, vol.42, no.3, p. 300-311, Mar. 1993. Lampinen, J.; Oja, E.. Distortion tolerant pattern recognition based on self-organizing feature extraction, IEEE Transactions on Neural Networks, 1995. Lien, J., Kanade T., Cohn, J. F., Li, C. C.. Detection, tracking, and classification of action units in facial expression. Journal of Robotics and Autonomous System, 31:131-146, 2000. Lin, C. T.; Lee, C. S. G.. Neural Fuzzy Systems A Neuro-Fuzzy Synergism to Intelligent Systems. New Jersey: Prantice Hall, 797 pg., 1996. Lyons, M. J., Akamatsu, S., Kamachi, M., Gyoba, J.. Coding Facial Expressions with Gabor Wavelets, Proceedings, 3rd IEEE International Conference on Automatic Face and Gesture Recognition, pp. 200-205, Apr. 1998. Lyons, M. J., Budynek, J., Plante, A., Akamatsu, S.. Classifying Facial Attributes Using a 2-D Gabor Wavelet Representation and Discriminant Analysis, Proceedings, 4th International Conference on Automatic Face and Gesture Recognition. 28-30 March, 2000, Grenoble France, IEEE Computer Society, pp. 202-207.

152

Maio, D., Maltoni, D., Rizzi, S.. Topological Clustering Of Maps Using A Genetic Algorithm. Pattern Recognition Letters, vol. 16, no. 1, pp. 89-96, 1995. Manjunath, B. S.. Perceptual Grouping and Segmentation Using Neural Networks, Signal and Image Processing Institute, University og Southern California, 119 pg., Dez. 1991. Manjunath, B. S., Chellappa, R., Malsburg, C. v. d.. A feature based approach to face recognition. California: Computer Vision Laboratory, Center for Automation Research , Univ. of Maryland., Janeiro 1992. 35p. (CAR-TR-604 and CS-TR-2834) Maren, A., Harston, C., Pap, R.. Handbook of Neural Computing Applications. Academic Press, Inc. San Diego, 1990. 450p. Marr, D.. Vision. W. H. Freeman & Company, New York, 1982. McMinn, R. M. H., Hutchings, R. T., Logan, B. M.. Atlas Colorido de Anatomia da Cabea e Pescoo, 2 ed., Editora Artes Mdicas LTDA, 247 pg., 2000. Oliveira, D. R., Guimares, L. N. F.. Sistema Hbrido Inteligente Aplicado ao Reconhecimento de Faces, Simpsio de Cincias Exatas e da Terra, UNIVAP, So Jos dos Campos SP, 2001a. (painel). Oliveira, D. R., Guimares, L. N. F.. Sistema Hbrido Inteligente Aplicado ao Reconhecimento de Faces, I Workshop de Computao Aplicada (I WORCAP), INPE, So Jos dos Campos SP, 2001b. (painel). Oliveira, Y. G.. Implemantao de um reconhecedor neural de faces. Projeto Orientado em Cincia da Computao, 1994. Oliveira, C., Silva, F., Oliveira, T.. Processamento de Lngua Natural: Uma Abordagem Simblica ou Conexionista? So Jos dos Campos: Instituto Nacional de Pesquisas Espaciais, 1996. 50p. (INPE-5971-PRP/194).

153

Oliveira, Y. G.. Classificao de Metodologias para Reconhecimento Automtico de Faces Humanas. Dissertao de Mestrado, Universidade Federal de Minas Gerais, 1997. Pedroza, L. C. C., Pedreira, C. E.. Uma Nova Metodologia para Treinamento em Redes Neurais Multicamadas, vol. 11 no. 1, pp. 49-54, 2000. Petrelli, E.. Ortodontia Contempornea, 2 ed., Sarvier, 370 pg., 1993. Pham, D., Liu, X.. Neural Networks for Identification, Prediction and Control. SpringerVerlag, 1995, 238p. Plunkett, K. Elman, J. L.. Exercises in Rethinking Innateness A Handbook for Connectionist Simulations, 3 ed., MIT Press/Bradford Books, 313 pg., 1997. Polikar, R. The Wavelet Tutorial, [on line] <http://www.public.iastate.edu/

%7erpolikar/WAVELETS/WTtutorial.html>, 1995. Porat, M., Zeevi, Y.. The Generalized Gabor Scheme of Image Representation in Biological and Machine Vision, IEEE, 1988. Proffit , W. R.. Diagnstico e Planejamento de Tratamento. Ortodontia Contempornea. p.138, 1991. Randall S. S., Jatinder N. D. G.. Comparative evaluation of genetic algorithm and backpropagation for training neural networks, Information Sciences, 2000. Rempel, E. L.. Reconhecimento de Padres Invariantes a Rotao Utilizando uma Rede Morfolgica No-Supervisionada. So Jos dos Campos: Instituto Nacional de Pesquisas Espaciais, 2000. 81p. (INPE-7994-TDI/748). Rowley, H. A., Baluja, S., Kanade, T. Human face detection in visual scenes. Pittsburg: Carnegie Mellon University, November 1995. 24p. (CMU-CS-95-158R). Rowley, A. H., Baluja, S., Kanade, T.. Rotation Invariant Neural Netwoar-Based Face Detection. Technical Report. CMU-CS-97-201, Carnegie Mellon University, 1997.

154

Senna, A. L.. Previso de qualidade de aglomerados de finos de minrio utilizando redes neurais. Dissertao de Mestrado, Universidade Federal de Minas Gerais, 1996. Shioyama, T., Wu, H. Mitani, S.. Segmentation with Gabor Filters and Cumulative Histograms, IEEE, 1999. Sinha, P.. Object Recognition via Image Invariants: A Case Study. In Investigative Ophthalmology and Visual Science, vol 35, pp. 1735-1740, May, 1994. Suguino, R., Ramos, A. L., Tereda, H. H., Furquin, L.Z., Maeda, L., DA Silva Filho, O. G.. Anlise Facial. Revista Dental Press de Ortodontia e Ortopedia Maxilar, vol. 1, no. 1, pp. 86-107, 1996. Sung, K.K., Poggio, T.. Example-based Learning for View-based Human Face Detection. Massachusetts: Massachusetts Institute of Technology, December 1994. 20p. (AIM-1521/C.B.C.L. No 112). Tian, Y., Kanade, T., Cohn, J.. Recognizing upper face actions for facial expressions analysis. In Proceedings Of CVPR'2000, pg. 294-301, 2000a. Tian, Y., Kanade, T., Cohn, J.. Recognizing lower face actions for facial expression analysis. In Proceedings Of International Conference on Face and Gesture

Recognition, pg. 484-490, Mar. 2000b. Tian, Y., Kanade, T., Cohn, J. F.. Recognizing Facial Actions by Combining Geometric Features and Regional Appearance Patterns. Pittsburg: Carnegie Mellon University, January 2001. 31p. (CMU-RI-TR-01-01). Viazis, A.D.. Avaliao do Tecido Mole. Atlas de Ortodontia. Princpios e Aplicaes Clnicas. p. 49, 1996. Wasserman, P.. Neural Computing Theory and Pratice. Van Nostrand Reinhold. New York, 1989. 230p.

155

Wiskott, L., Fellous, J.-M.; Kruger, N., Malsburg, C.von.der.. Face recognition by elastic bunch graph matching. Germany: Institut fur Neuroinformatik, RuhrUniversitat Bochum. 1996. 23p. (IR-INI 96-08 / D44780). Yuille, A., Halliman, P., Cohen, D.. Feature Extraction from Faces using Deformable Templates. International Journal of Computer Vision, 8 (2): 99-111,1992. Zurada, J. M.. Introduction to Artificial Neural Systems. St Paul, USA, 1992. Zhang, Z., Lyons, M., Schuster, M., Akamatsu, S.. Comparison Between GeometricBased and Gabor-Wavelets-Based Facial Expression Recognition Using Multi- Layer Percetron. Proceedings, 3rd IEEE International Conference on Automatic Face and Gesture Recognition, April 1998, Nara Japan, p. 454-459.

156

APNDICE A
O T-learn foi escolhido para ser o simulador neural desta dissertao por ser fcil de usar e flexvel a alteraes rpidas de estrutura e parametrizao. Alm disso, ele possui uma gama de ferramentas teis avaliao e anlise das arquiteturas de rede neurais implementadas.

O simulador de redes neurais T- learn foi programado para ser compatvel com diversas plataformas incluindo Macintoshes, Windows e muitas mquinas UNIX que executam o X-windows. O T- learn pode ser adquirido via ftp (File Transmission Protocol) annimo no endereo: ftp.psych.ox.ac.uk ou pelo endereo http://crl.ucsd.edu/innate.

A seguir ser descrito, de forma sucinta, o funcionamento bsico do T- learn e de alguns de seus recursos.

Para iniciar o processo de construo de uma nova rede neural usando o T- learn, seleciona-se o item Network na barra de menu, como mostrado na Figura A1:

FIGURA A1 Iniciando novo projeto de rede neural. Aps escolher o nome do projeto e a pasta onde deseja armazen- lo, 3 arquivos sero criados pelo T- learn para gerenciar o projeto. Para ilustrar o processo de criao de uma

157

rede neural com o T- learn, ser criada aqui uma rede capaz de solucionar o problema da porta lgica XOR. Portanto, aps escolher o nome XOR para o projeto, 3 arquivos com o mesmo nome so automaticamente criados, cada qual com sua funo e extenso especfica, como mostrado na Figura A2.

FIGURA A.2 Projeto XOR com as respectivas janelas de configurao. Cada janela ser usada para a entrada de informaes relevantes a diferentes aspectos da arquitetura da rede e ambiente de treinamento. A janela referente ao arquivo XOR.cf usada para definir o nmero de nodos da rede e os padres iniciais de conexo entre estes nodos antes do incio do treinamento. A janela do arquivo XOR.data define quantos so os padres de entrada da rede, e o formato atravs do qual eles esto representados no arquivo. Por fim, a janela referente ao arquivo XOR.teach define os padres esperados na sada da rede, detalhando quantos so estes padres, e o formato que eles esto representados. Por conveno, o T- learn necessita que qualquer projeto de simulao possua os 3 arquivos listados anteriormente. Ele espera ainda que estes arquivos possuam as extenses .cf, .data e .teach. Todos os arquivos pertencentes a um mesmo projeto devem ter o mesmo nome. As informaes do projeto so armazenadas em um arquivo especial sem extenso criado no momento da escolha do nome do projeto. No caso do exemplo aqui apresentado, foi criado automaticamente o arquivo XOR. Este arquivo identifica o projeto e faz a ligao com os outros 3 arquivos especficos para cada funo. Para abrir

158

um projeto j existente no T-learn, deve-se abrir este arquivo principal no menu Network, opo Open Project, e ele se encarrega de abrir os demais arquivos especficos (.cf, .data e . teach). O T-learn sensvel a letras maisculas e minsculas, alm de espaos em branco. Portanto, deve-se estar atento na digitao dos comandos especficos de cada uma das janelas descritos a seguir. O arquivo XOR.cf contm 3 sesses:

A sesso NODES especifica o nmero total de unidades da rede e identifica quais nodos executam o papel de entrada e sada da rede.

A sesso CONNECTIONS interconectadas.

especifica

como

as

unidades

so

A sesso SPECIAL fornece informaes que determinam o valor inicial das conexes e especifica as unidades cujos valores de ativao esto disponveis para inspeo.

O arquivo XOR.cf deve ter o contedo mostrado na Figura A3.

FIGURA A.3 Contedo do arquivo XOR.cf. Note que as sesses so delimitadas, sendo escritas em letras maisculas e seguidas de dois pontos :. As instrues tm as seguintes funes:

159

NODES: define o incio do bloco de nodos; nodes = 3 define quantos nodos faro parte da rede; inputs = 2 define o nmero de entradas da rede; outputs = 1 define quantos sero os neurnios de sada da rede; output node is 3 define qual dos neurnios ser a sada da rede; CONNECTIONS: define o incio da sesso que estabelece as conexes entre nodos; groups = 0 diz ao T -learn quantos grupos de conexes so restritos a ter o mesmo valor. Na rede atual, no h nenhuma restrio, portanto define-se que groups = 0; 1-2 from i1- i2 define que os neurnios 1 e 2 recebem entradas de i1 e i2; 3 from 1-2 define que o neurnio 3 recebe as sadas dos neurnios 1 e 2 como entradas; 1-3 from 0 define que os 3 neurnios da rede recebem entradas de um bias; SPECIAL: define o incio de uma nova sesso; selected = 1-3 diz ao T-learn quais unidades esto sendo selecionadas para impresso especial; weight-limit = 1.00 define que o intervalo de inicializao dos pesos deve estar enter 0 e 1. O arquivo XOR.data define os padres de entrada que sero apresentados ao Tlearn. A entrada dos dados deve ser feita como mostrado na Figura A.4.

FIGURA A.4 Contedo do arquivo XOR.data. A primeira linha desse arquivo deve ser o comando distributed. A linha seguinte define o nmero de padres que devem ser apresentados rede em i1 e i2, j citados no arquivo XOR.cf.

160

O arquivo XOR.teach mostrado na Figura A.5. A primeira linha de arquivo segue o mesmo padro descrito no arquivo XOR.data. A linha seguinte determina a quantidade de padres de sada para as respectivas entradas apresentadas no arquivo XOR.data. A cada uma das linhas do arquivo XOR.teach, est relacionada a entrada presente no arquivo XOR.data. Ento, para o padro de entrada 0 0, espera-se a sada 0 e assim por diante.

FIGURA A.5 Contedo do arquivo XOR.data.

Desta forma, termina-se a etapa de parametrizao da rede. Pode-se verificar a arquitetura rede criada usando-se o menu Displays e escolhendo a opo Network Architecture.

Para a rede construda no exemplo citado aqui, tem-se a arquitetura ilustrada na Figura A.6.

161

FIGURA A.6 Arquitetura da rede criada. Aps a definio da estrutura, conexes, padres de entrada e sadas desejadas, necessrio definir os parmetros de treinamento. Isso feito atravs do menu Networks, escolhendo-se a opo: Training options. A tela de configurao dos parmetros de treinamento mostrada na Figura A.7.

FIGURA A.7 Janela de parmetros de treinamento da rede.

162

Atravs desta tela possvel se configurar os parmetros de treinamento da rede, tais como nmero de pocas, valor do bias, taxa de aprendizado, momentum, erro mdio quadrtico aceitvel, etc.

Feitas as devidas configuraes, para efetuar o treinamento da rede, atravs do menu Network, escolhe-se a opo Train the network.

Para acompanhar o grfico de evoluo do erro durante o treinamento, seleciona-se atravs do menu Displays, a opo Error display. O grfico resultante mostrado na Figura A.8.

FIGURA A.8 Grfico de evoluo do erro mdio quadrtico. A verificao do real aprendizado da rede feita atravs do menu Networks escolhendo-se a opo Verify network has learned. Nesse momento, so novamente apresentados rede os padres usados no treinamento e so avaliados os valores de sada apresentados pela rede. Para o exemplo aqui mostrado, os valores de sada obtidos aps 4000 iteraes com os parmetros usados no treinamento foram:

163

Output activations using XOR-4000.wts and XOR.data (Training Set) 0.023 0.976 0.976 0.030

As sadas mostram que a rede realmente aprendeu os padres apresentados. Para a apresentao de padres que no estavam presentes no treinamento da rede, formando um conjunto de validao de dados, basta criar um novo arquivo novels.data atravs do menu File opo New. Nesse arquivo, seguindo os mesmos padres do arquivo .data, entra-se com os novos valores. No menu Networks, opo Testing options deve-se alterar a opo Testing set para Novel data e colocar na caixa de texto ao lado, o nome do arquivo de testes (novels.data aqui descrito). Feito isso, para submeter os novos padres rede, basta acessar o menu Networks e escolher a opo Verify network has learned. O novo conjunto de padres ser submetido rede e sero apresentadas as respostas da rede a esses padres.

O T- learn oferece muitos outros recursos, como anlise de componentes principais, anlise de clusters, verificao grfica da ativao dos nodos sob a presena dos padres de ent rada entre outras ferramentas de anlise.

Maiores detalhes do funcionamento e recursos do T- learn podem ser encontrados no endereo: http://crl.ucsd.edu/innate ou no livro Exercises in Rethinking Innateness a Handbook for Connectionist Simulations, presente nas referncias bibliogrficas desta dissertao.

164

You might also like