You are on page 1of 15

El trabajo aborda el reconocimiento de rostros usando redes neuronales de retropropagacin.

La red es implementada en Matlab.

Es entrenada con 5 imgenes (fotos) distintas

pertenecientes a varios individuos.


La prueba, realizada con otro set de 5 fotos de los

mismos individuos, entrega una precisin de 90% para la identificacin.

El tema de Reconocimiento de Rostros ha cobrado

gran importancia en el contexto actual, en lo que respecta a medidas de seguridad (aeropuertos).


El trabajo aborda el reconocimiento de rostros usando

Redes Neuronales de Retropropagacin


La red es implementada en Matlab. En la actualidad los estudios en esta materia siguen 2

mtodos: Estadstico (probabilidades) Conexionista (reconocimiento de patrones).

Otros sistemas de reconocimiento: Pentland (1994) y

Malsburg (1995), se basan en propiedades de las imgenes.


Reconocer rostros se ha asociado tradicionalmente al

reconocimiento de imgenes, lo cual es un enfoque netamente perceptual y no cognitivo.


En este trabajo se adopta que: LA AFIRMACIN

ANTERIOR ES ERRNEA, EL RECONOCIMIENTO DE ROSTROS ES UNA ACTIVIDAD PERCEPTUAL Y COGNITIVA, que difiere de sobremanera del reconocimiento de objetos.
Ejemplo: LOS NIOS APRENDEN A DISTINGUIR

ROSTROS ANTES QUE OBJETOS.

Implementar una Red Neuronal de Retropropagacin

para Reconocimiento de Rostros.


Los datos son un set de conjunto fotos, 10 fotos de 40

individuos. En formato pgm y la imagen en 256 niveles de gris, como una matriz de 92x112 bytes.
Caractersticas de las imgenes: tomadas sobre un fondo

homogneo obscuro, rotacin mxima de 20 y la mxima variacin de escala es de 10%. La diversidad tambin considera tomos con y sin anteojos y cambios en el peinado.

Datos Entrenamiento: Las primeras 5 fotos de cada uno

de los individuos.
Datos Prueba: La prueba consisti en presentar a la red,

las 5 fotos restantes de cada uno de los individuos.


A cada muestra le corresponde un cdigo con un nmero

de posibilidades igual a: 13189120=5x92x112x256


PRECAUCIN:

PUEDE QUE LA RED NO PASE LA ETAPA DE ENTRENAMIENTO, DEBIDO A LA GRAN CANTIDAD DE POSIBILIDADES ES MUY DIFCIL QUE LA RED PUEDA ASOCIAR UNVOCAMENTE A LA MUESTRA CON UN INDIVIDUO.

SOLUCIN:

DOTAR A LA RED DE UN NMERO SUFICIENTEMENTE GRANDE DE PESOS, DE MODO QUE MEMORICE EL ESPACIO MUESTRAL Y COMPLETE AS SU ETAPA DE ENTRENAMIENTO. Aqu se puede llegar a una situacin de SOBREENTRENAMIENTO; la red carece de la capacidad de generalizacin, al procesar el espacio de prueba entrega respuestas errneas.

Para modelar el proceso se postula una caracterstica

cuantitativa que tiene 2 parmetros: k: corresponde al nmero de individuos. m: nmero de fotos de cada uno de ellos.
Se plantea una arquitectura con 2 capas ocultas. La capa

de INPUT tiene 10304 nodos, la 1a Capa Oculta tiene 2x(k+2) neuronas; la 2da Capa Oculta tiene (k+m) neuronas. La capa OUTPUT tiene k neuronas.
Las funciones de activacin de las capas ocultas son tanh

(tangente hiperblica).

Los

resultados de sta asociacin de datos, proporciona una medida de confusin, situacin anloga al proceso de reconocimiento de rostros en los seres humanos, dado que los rostros presentan caractersticas comunes entre s.

Los datos fueron normalizados, esto es: media nula y

varianza unitaria.
El script de Matlab, con el cual se realiz el trabajo, se

muestra a continuacin:

El proceso hasta la etapa de fin del entrenamiento

tard alrededor de 6 minutos.


Prueba: Los datos se almacenaron en 2 matrices. La

matriz A, con los datos de entrenamiento; y la matriz B, con los datos de prueba. Finalmente se calcul la matriz (B-A), matriz que mide el grado de confusin en la identificacin.
Anlisis de Resultados: En la figura siguiente, se

muestra la grfica de la matriz (B-A). Los spikes (con un valor mximo de 0.5), INDICAN ALGN GRADO DE CONFUSIN DE LA RED.

Despliegue de la matriz (B-A)


0.6 0.4 0.2 0 -0.2 -0.4 -0.6 -0.8 40 30 20 100 10 0 0 50 150 200

Los principios de diseo de la red dieron excelentes

resultados en reconocimiento de rostros, tanto en tiempo como en fidelidad de identificacin.


El SOBRE-APRENDIZAJE NO se produjo, debido a

que el procedimiento de prueba involucr imgenes distintas a las del entrenamiento.


La NORMALIZACIN de los datos prob ser un

mtodo muy eficiente. Sin este procedimiento, la convergencia no se alcanza en menos de 100 pocas.

A partir del punto anterior, se puede decir, que es

imprescindible pre-procesar los datos para su mejor anlisis.


La extraccin de caractersticas relevantes desde las

imgenes, es realizada en forma satisfactoria por la red.


El flujo neto de seales debe ser REDUCIDO, al igual

como lo es en seres humanos.

You might also like