Professional Documents
Culture Documents
Elaborado por:
Jhonnatan Cochancela
Contenido
1. DESCRIPCIÓN .................................................................................................................... 2
1.1. ADQUISICIÓN DE LA SEÑAL DE VOZ ......................................................................... 3
1.2. ANÁLISIS DE LA VOZ- ESTRACCIÓN DE CARACTERÍSTICAS ...................................... 3
1.3. ENTRENAMIENTO Y MODELOS ................................................................................ 5
1.4. COMPARACIÓN DE PATRONES Y LÓGICA DE DESICIÓN .......................................... 6
1.5. GENERACIÓN DE REPORTE ....................................................................................... 7
2. FUNCIONAMIENTO ........................................................................................................... 8
Índice de figuras
Figura 1 Reconocimiento de voz .................................................................................................. 2
Figura 2 Adquisición de la señal de voz ........................................................................................ 3
Figura 3 Extracción de la característica de la voz ......................................................................... 4
Figura 4 Sub VI Principal del Análisis de la voz. ............................................................................ 4
Figura 5 Sub VI para dividir en tramas de 20ms ........................................................................... 4
Figura 6 Sub VI Umbral de ruido .................................................................................................. 5
Figura 7 Matrices de entrenamiento ........................................................................................... 5
Figura 8 Etapa de comparación de patrones ............................................................................... 6
Figura 9 Sub VI Distancia Euclidiana ............................................................................................. 6
Figura 10 Lógica de decisión......................................................................................................... 7
Figura 11 Sub VI Dynamic Time Warping ..................................................................................... 7
Figura 12 Lógica para generación de reporte .............................................................................. 7
Figura 13 Sub VI Para generar el reporte ..................................................................................... 8
Figura 14 Pantalla principal del programa ................................................................................... 9
Figura 15 Comando de voz "A" (Arranque de la bomba) ............................................................. 9
Figura 16 Comando de voz "P" (Parada de la bomba) ................................................................. 9
Figura 17 Comando de voz "Reporte" (Genera reporte de arranques exitosos) ....................... 10
Figura 18 Reporte generado....................................................................................................... 10
Figura 19 Comando de voz "FIN" (Detiene la ejecución del programa)..................................... 10
1. DESCRIPCIÓN
ADQUISICIÓN
SEÑAL DE VOZ
ANÁLISIS DE LA VOZ
ENTRENAMIENTO
MODELOS/TEMPLATES
COMPARACIÓN DE
PATRONES
LÓGICA DE DECISIÓN
PALABRA
RECONOCIDA
Para esta etapa se utiliza Acquire Sound Express VI de LabVIEW, para lo cual se realiza
un muestreo a una taza de 11025Hz cada 4 segundos como se observa en la Figura 2.
Dentro del análisis de la voz tenemos una sub-etapa que es el pre-énfasis, para hacer
menos sensible al sistema, luego se pasa a la señal de entrada por un filtro de orden
bajo (FIR) de manera de aplanar su espectro.
Se divide la señal de voz en tramas de 20ms donde se asume que la señal es cuasi-
estacionaria.
Cada cuadro es pasado por un ventaneo para minimizar las discontinuidades de la señal
al principio y al final de cada trama. En este caso se utiliza el ventaneo de Hamming.
Por último, cada trama se computa los coeficientes LPC, en este caso 15 coeficientes,
esto implica una reducción de la tasa de información.
1.3.ENTRENAMIENTO Y MODELOS
1.5.GENERACIÓN DE REPORTE
Finalmente, el programa permite generar un reporte en Excel en el cual se puede observar
cuantos arranques fallidos y cuantos arranques exitosos ha tenido la bomba; es decir, permite
llevar una estadística, esto con el fin de realizar un control de calidad del proceso.
2. FUNCIONAMIENTO
En la Figura 14 se observa la pantalla principal del programa previo a emitir los comandos
de voz (VI PRINCIPAL: RECONOCIMIENTO_PATRONES). En la Tabla 1 detalla los comandos
utilizados y la acción que toman sobre el programa al ser reconocidos.