Professional Documents
Culture Documents
Ac
desar
llo
ro
ay
Hugo Velasco
Miguel Escandn
Csar Rodrguez
ABSTRACT
This document presents a study of some of the
main technologies available for speech recognition
and wireless communications. Also the
implementation of a mobile system is presented, this
mobile is able to respond to the users voice, by using
of efficient methods for the movement control.
Se busca disear
un sistema de
comando remoto
y porttil capaz
de responder a
ordenes dadas
por voz humana,
y segn estas,
realizar el control
de un mvil
accionado por
motores.
I. INTRODUCCIN
Artculo recibido en Abril de 2002
Aceptado en Junio de 2002
72
Vol. 7 No
.1
No.1
Ingeniera
herramientas elctricas, computadores y robots, dotados con la capacidad de atender a comandos de voz,
dados por el operario del dispositivo. Es por ello que
en la actualidad, muchas empresas desarrolladoras de
tecnologa se encuentran trabajando en prototipos de
bajo costo, para brindar al usuario final la facilidad de
interfaces hombre-mquina mucho mas amigables,
abrindose de este modo un mercado potencial de
productos electrnicos. Estas nuevas tecnologas tambin contribuirn a mejorar la calidad de vida de personas con discapacidades fsicas [1].
Por lo tanto es necesario, hacer uso de la tecnologa
disponible para llegar a aplicaciones tiles, y de esta
manera poder valorar los alcances reales de la misma;
evaluando parmetros de confiabilidad, relacin costo beneficio y escala de integracin entre otros.
Este artculo se organiza de la siguiente manera:
en la seccin 2 se da a conocer el problema. En la
seccin 3, se realiza un estudio sobre algunas de las
principales tecnologas disponibles tanto para el reconocimiento de voz, como para la transmisin de
datos. En la seccin 4, se detalla la forma en que fue
implementado un modelo de aplicacin, para la comprobacin del sistema de voz. En la seccin 5, se
plantea el uso de otra tecnologas para la mejora de
los resultados obtenidos.
RECONOCIMIENTO
DE HABLA
(HM2007)
SCVR
POTENCIA
MVIL
CONTROL
(AT8951
MC68HC908JL3)
IR
COMUNICACIONES
TX (MC145026)
COMUNICACIONES
RX (MC145027)
Este mtodo presenta varios inconvenientes debido a que se toman muestras de 0.5 segundos para su
anlisis. Si este tiempo no coincide con el momento
en que se habla, la evaluacin de la palabra es incorrecta; adems presenta un gran retardo en lograr la
identificacin del comando dado.
La segunda opcin que se estudio fue el integrado HM2007 de
H U A L O N
Microelectronic
Corp., el cual
consiste en una
red neuronal apliFig. 4. Presentacin final del kit de
cada al reconocidesarrollo del HM 2007.
miento de coSe destaca el teclado de
programacin, el micrfono para la
mandos de voz.
captura de voz y la salida en BCD.
En la figura 4 se
muestra el mdulo de reconocimiento de voz, a travs del cual se toma la seal de voz, se procesa y
finalmente, se genera un cdigo digital el cual est
asociado al comando que ha reconocido.
Algunas de las caractersticas del HM 2007 son:
Reconocimiento mximo de 40 palabras de 0.96
segundos de duracin.
Reconocimiento mnimo de 20 palabras de 1.92
segundos de duracin.
Soporte de RAM externa, donde se almacenan los
descriptores de cada palabra.
Soporte de micrfono externo.
Utiliza tecnologa CMOS LSI, con lo que se tiene
un bajo consumo de energa.
Se escogi este CI debido a su relacin costo/prestaciones, dentro de una moderada gama de integrados que se pueden conseguir en el mercado. Este
integrado reconoce un 100% ms de palabras, que
otros que realizan la misma funcin.
Este integrado facilita enormemente la labor de entrenamiento y reconocimiento de voz, ya que cuenta
con interfaces para teclado matricial 4x3, junto con una
salida de datos en BCD, lo cual facilita el manejo y la
decodificacin de las instrucciones.
Con la red neuronal, se obtuvo una efectividad del
89% para reconocer los comandos entrenados, para
la persona que realiz el entrenamiento. Para otras
personas vara entre un 60% a un 85% de efectividad.
Despus de haber evaluado estas tecnologas para
el reconocimiento de voz, se escogi usar el CI
HM2007, por cumplir mejor con los requerimientos
de portabilidad y relacin costo-eficiencia.
3.2. COMUNICACIONES
Cuando se reconoce una palabra previamente entrenada se le enva un cdigo al mvil para que adopte
una opcin de movimiento, las palabras que se eligieron se observan en la tabla I junto con el respectivo cdigo que se le enva al mvil:
Vol. 7 No
.1
No.1
Ingeniera
73
VOZ DE
MANDO
Adelante
GO
Atrs
BACK
Izquierda
IZQ
Derecha
DER
Alto
STOP
Acelere
FAST
Desacelere
SLOW
Ven
COME
CODIGO
00110000
00100001
00100000
01000000
00010001
00110001
00010010
00110010
00010011
00110011
00010100
00110100
00011000
00111000
00011001
00111001
00000001
00000011
Una segunda alternativa para lograr la comunicacin entre el SRCV y el mvil utiliza un par de transmisin-recepcin de datos fabricado por Motorola,
especial para comunicaciones seriales por infrarrojo,
MC145026 (emisor) y MC145027 (receptor). Estos
permiten transmitir las palabras ya codificadas hacia
el mdulo de control aprovechando los datos de un
nibble de longitud que se pueden enviar por medio
de estos integrados [4], [5].
Dada la confiabilidad en la transmisin lograda,
gracias a los sistemas de prevencin de errores internos que poseen los integrados MC1450CXX y a su
flexibilidad para establecer diferentes canales de comunicacin, se adopt la opcin IR, como sistema a
implementar en el prototipo final.
Debido a que es
necesario
controlar el
sentido de giro
del mvil se
hacen girar los
motores en
direcciones
opuestas, lo que
da como
resultado un
movimiento
circular
alrededor del
centro del eje.
74
Vol. 7 No
.1
No.1
Ingeniera
emite informacin en el mismo canal de comunicacin, seleccionado por el receptor, es decir, el mvil.
Cuando la seal es activa en ambos receptores, el
sistema de control toma la decisin de dar marcha
hacia adelante a ambos motores, para dirigir el mvil
hacia la fuente. Si alguna seal se pierde en este proceso, el control
produce un giro
correctivo del
mvil hacia la
direccin en la
cual an se encuentra presente la seal de recepcin. Esto
Figura 5. Comportamiento grfico del
se muestra en la
algoritmo de seleccin. Las flechas
figura 5.
indican el sentido de giro de las llantas.
IV. MVIL
El proceso de diseo tuvo en cuenta las etapas a
continuacin, en las cuales se fija como parmetro principal la eficiencia del sistema.
4.1 Sistema de traccin del mvil
Dado que el mvil debe salir de dificultades cuando se encuentre en condiciones adversas como un
terreno escabroso u obstculos, es importante que
el sistema de traccin sea lo mas potente posible.
anterior en el momento en que se efectuaba algn cambio de estado sobre los motores, por lo tanto fue necesario desacoplar totalmente el sistema de alimentacin, de los sistemas de traccin y control.
La alimentacin del mvil es una batera de 6V @
4Ah (Amperios hora). Fue escogida porque brinda una
autonoma bastante amplia para el funcionamiento de
los sistemas. La batera tiene unas dimensiones
(108mm x 70mm x 47mm) y peso (0.9kg), apropiados
para la capacidad de carga del sistema de traccin.
Para obtener la alimentacin regulada del circuito de
control, se utiliz un conversor reductor LM2678T-5
de National Semiconductors [6], de 5V @ 3A.
El manejo de los motores se realiza por medio de
relevos electromecnicos, configurados como puente
H, para conseguir la inversin de la polaridad. Se hace
necesario adems, minimizar las prdidas que puedan
tener los interruptores que se conmutan en el puente
H. Los relevos utilizados para la implementacin son
los ATX221 M01 de doble bobina fabricados por NaiS.
Estos relevos cuentan con memoria, ya que con slo
un pulso de corriente se logra el cambio de estado y
sostenimiento de ste, sin necesidad de mantener
energizada la bobina, esto por cada interruptor. Con
la aplicacin de un pulso sobre la otra bobina se logra
cambiar el estado del interruptor.
En comparacin con los relevos clsicos, que deben
mantener la alimentacin del electroimn para conservarse en cierto estado, se logra un ahorro significativo
de energa. Esto en vista a que los cambios de accin
ocurren en un tiempo pequeo, con respecto al tiempo
que dura realizando una accin en particular.
Para administrar la energa a los motores se utiliza
una modulacin por ancho de pulso (PWM) [7], [8], de
la fuente de alimentacin, con lo que se obtuvo una
mejora sustancial en la autonoma del mvil, al compensarse la cada de tensin que se presenta con el tiempo. Esto se logra con un incremento del porcentaje de
ciclo til mximo de la seal, con que se excita a los
motores. Este sistema se implemento por medio del
mdulo de temporizacin del C MC68HC908JL3 de
Motorola [9], que funciona como PWM.
4.3 Sistema de control del mvil
El sistema de control del mvil se implementa por
medio de un microcontrolador 8951 de ATMEL [10]
junto al C MC68HC908JL3. La seleccin de estos
dos C se debe al aprovechamiento de las caractersticas individuales, como nmero de puertos I/O disponibles en el 8951, y los perifricos de temporizacin
y conversin anlogo-digital que posee el JL3. La funcin que desempea este conjunto hace posible recibir las seales de los sistemas de comunicacin y con
base en los cdigos recibidos tomar las decisiones correspondientes, como se describi anteriormente.
V. TRABAJO A FUTURO
Despus de la realizacin de un pequeo modelo
del sistema de comando remoto, se podra llevar a
CONCLUSIONES
Dado que los requerimientos tanto de hardware
como de software, necesarios para realizar el procesamiento de las seales y en este caso seales de voz son
tan grandes, los tiempos de respuesta que se deben
esperar de ningn modo cumplen con exigencias de
tiempo real. Por lo tanto las aplicaciones en las cuales
se utilice este sistema, no podrn demandar tiempos
despreciables de respuesta (tiempos menores a 2 seg).
Cuando se realizan implementaciones, para mdulos que requieren determinadas condiciones de autonoma y consumo de energa, la relacin peso vs.
capacidad Ah es un doble compromiso por parte del
diseador. Es decir, se requiere llegar a un rango ptimo, donde se presente el mnimo peso con la mayor autonoma.
De acuerdo con las pruebas realizadas al prototipo
final, durante el da, en un espacio cerrado e iluminado
con lmparas fluorescentes, se determin que se pueden
alcanzar distancias mximas de transmisin de 15 m.
La interferencia de la luz es un problema crtico
en el proceso de comunicaciones IR, entre los elementos del sistema, ya que afecta los umbrales de
deteccin de luz infrarroja.
El sistema cuenta con una efectividad para responder
a los comandos de 60% a 85%, para cualquier usuario.
REFERENCIAS
[1] SEAL COLOMBIA. (Documental en Video). Bogot. Diciembre 2001.
[2] NATIONAL INSTRUMENT. Labview basics course manual. April 1998
Edition.
[3] Spevak P., y Loy M. Texas Intruments. Application Report. SWRA034B May 2001.
[4] MOTOROLA. Encoder and Decoder Pairs. MC145026/D. Revisin 3. 1998.
[5] JAN AXELSON. Comunicaciones inalmbricas con PC. Electrnica y computadores. Cekit. 1997
[6] NATIONAL SEMICONDUCTOR. Power Ics Databook. USA. 1995.
[7] SAVANT, RODEN y CARPENTIER, Diseo Electrnico. Addison-Wesley
Iberoamericana. USA. 1992.
[8] BOYLESTAD, Robert L.; NASHELSKY, Louis. ELECTRONICA: Teora de
Circuitos. 6 Ed. Prentice Hall Hispanoamericana S.A., Mxico DF. 1996.
[9] MOTOROLA. MC68HC908GP32/H Technical Data. Revisin 5. Julio 2001.
[10] BERNAND ODANT. Microcontroladores 8051 y 8052. 1 Ed. Editorial Paraninfo. Madrid. 1995.
Estudiante de Ingeniera Electrnica, Universidad Distrital. Integrante del grupo de Instrumentacin Virtual. hvelasco@ieee.org
Estudiante de Ingeniera Electrnica, Universidad Distrital. Integrante del grupo de Instrumentacin Virtual. cesar_rodriguez80@yahoo.es
Vol. 7 No
.1
No.1
Ingeniera
75