You are on page 1of 10

Elisei, Natalia Gabriela ; Evin, Diego Alexis

Evaluación perceptivo auditiva de voces degra-


das y su correlación con medidas acústicas

Revista de Psicología Vol. 8 Nº 16, 2012

Este documento está disponible en la Biblioteca Digital de la Universidad Católica Argentina, repositorio institucional
desarrollado por la Biblioteca Central “San Benito Abad”. Su objetivo es difundir y preservar la producción intelectual
de la Institución.
La Biblioteca posee la autorización del autor para su divulgación en línea.

Cómo citar el documento:

Elisei, N. G., Evin, D. A. (2012). Evaluación perceptivo auditiva de voces degradas y su correlación con medidas
acústicas [en línea], Revista de Psicología, 8(16). Disponible en:
http://bibliotecadigital.uca.edu.ar/repositorio/revistas/evaluacion-perceptivo-auditiva-voces-degradas.pdf [Fecha de
consulta:..........]
44 Las situaciones de alfabetización temprana en hogares de dos grupos sociales de Argentina ISSN 1669-2438 Revista de Psicología. Año 2012. Vol. 8, Nº 16, pp. 45-61

Stein, A. & Rosemberg, C.R. (en prensa). Vernon-Feagans, L., Hammer, C., Miccio,
Redes de colaboración en situaciones de A. & Manlove. E. (2003). Early language
alfabetización familiar con niños peque- and literacy skills in low-income African Evaluación perceptivo auditiva de voces degradadas
ños. Un estudio en poblaciones urbano American and Hispanic children. En S.
y su correlación con medidas acústicas
marginadas de Argentina. Interdiscipli- Neuman & D. Dickinson (Eds.) Hand-
naria. book of early literacy research (pp.192-
Strauss, A. & Corbin, J. (1991). Basics of 210). Nueva York, E.E.U.U.:Guilford. Auditory - perceptual assessment of degraded voices
qualitative research. Grounded theory. Volk, D. & de Acosta, M. (2004). Mediating and its correlation with acoustic measures
Procedures and techniques. Londres: networks for literacy learning: The role
Sage. of Puerto Rican siblings. En E. Gregory, Natalia Gabriela Elisei*
Taylor, D. (1983). Family literacy: Young S. Long & D. Volk (Eds.), Many path- Diego Alexis Evin**
children learning to read and write. Lon- ways to literacy (pp. 25-39). Nueva York, 1

dres, Inglaterra: Heineman. E.E.U.U.: Routledge Falmer.


Taylor, D. & Strickland, D.S. (1986). Family Wasik, B. (2004) Handbook of family litera-
Storybook Reading. Portsmouth, New cy. Nueva York, E.E.U.U.: Guilford.
Hampshire, E.E.U.U.: Heinemann. Weizman, Z.O. & Snow, C. (2001). Lexical
Teale, W. (1986). Home background and input as related to children’s vocabu- Resumen la clase 0, 96% a la clase 2 y 79% a la clase 3. Un
young children’s literacy development. lary acquisition: Effects of sophisticated mayor número y variabilidad de casos se necesita
En W. Teale & E. Sulzby (Eds.), Emer- exposure and support for meaning. Deve- El objetivo es determinar utilizando las medicio- a fin de verificar los resultados preliminares.
gent literacy: Reading and writing (pp. lopmental Psychology, 17, 265-279. nes acústicas, qué información es más relevante
172-206). Norwood, Nueva Jersey, para el oyente al momento de categorizar el grado Palabras clave: Desórdenes vocales,
E.E.U.U.: Ablex. general de disfonía. Se eligieron 8 (4 voces feme- Análisis acústico de voz, GRBAS, Aná-
ninas y 4 voces masculinas. Cada emisión fue
evaluada auditivo perceptualmente a través del
lisis perceptual de la voz
item G de la escala GRBAS por 10 oyentes expe-
rimentados y acústicamente mediante medidas de
aperiodicidad, ruido y caos. El estudio estadístico
de análisis discriminante señala la importancia Abstract
de GNE, Jit y Jitter_cc y Lyapunov como pará-
metros predictores del grado general de disfonía. The goal is to determine using acoustic measu-
La aplicación del método k-means evidencia rements, which information is the most relevant
que existen rasgos en los parámetros acústicos to listeners at the time of categorizing the overall
empleados que permiten agrupar objetivamente degree of dysphonia. Eight voice signals were
las voces estudiadas con 100% de precisión para chosen (4 female voices and 4 male voices). Each

* Doctora en Ciencias de la Salud y Fonoaudióloga. Centro Interdisciplinario de Investigaciones en


Psicología Matemática y Experimental Dr. Horacio J. A. Rimoldi, Consejo Nacional de Investigaciones
Científicas y Técnicas (CIIPME-CONICET). Correo Electrónico: natalia.elisei@gmail.com
** Doctor en Ciencias de la Computación. Laboratorio de Investigaciones Sensoriales. Instituto de Neu-

rociencias, Hospital de Clínicas. Laboratorio LIS INIGEM. Correo Electrónico: diegoevin@gmail.com

Correo electrónico: natalia.elisei@gmail.com


Fecha recepción: 29 de febrero de 2012 – Fecha aceptación: 30 de octubre de 2012

Revista de Psicología. Año 2012. Vol. 8. Nº 16, pp. 25-44 Revista de Psicología. Año 2012. Vol. 8. Nº 16, pp. 45-61
46 Evaluación perceptivo auditiva de voces degradas y su correlación con medidas acústicas Evaluación perceptivo auditiva de voces degradadas y su correlación con medidas acústicas 47

voice was perceptually evaluated through the item una evaluación “gold standard” de este ca o degradada y que las aproximacio- pulsos glóticos irregulares de una com-
G of GRBAS scale by 10 experienced listeners fenómeno. nes conocidas no son realmente válidas ponente de ruido de baja frecuencia.
and acoustically by aperiodicity, noise and chaos
measures. The statistical study by discriminant Se postula que compartimos una (Kreiman et al., 1993). Las medidas relacionadas con la per-
analysis shows the importance of GNE, Jit and realidad perceptiva común (Wuyts, De Entre los diversos sistemas de des- turbación de la frecuencia (jitter) serían
Lyapunov Jitter_cc as parameters and predictors Bodt, & Van de Heyning, 1999). Con- cripción de voces patológicas, las más más importantes en la evaluación de la
of overall degree of dysphonia. The application secuentemente, si esto fuese así, las comunes se concentran en el grado de aspereza que las relativas a la amplitud,
of the k-means evidence there are features in the
acoustic parameters that allow us to objectively
descripciones de la percepción de la “ronquera” sinónimo de disfonía (Hira- aunque principalmente la relación armó-
group the voices studied with 100% accuracy for voz serían intuitivas para cualquiera de no, 1981) (Nawka, Anders, Cebulla, & nico a ruido (HNR, harmonic to noise
class 0,96% for class 2 and 79% for class 3. A nosotros (Kreiman, Geratt, & Kemp- Zurakowski, 1997). La percepción de las ratio) parece ser el principal indicador
greater number and variability of cases are need ster, 1993). Algunos de los atractivos anomalías en la voz podría ser calificada de esta característica. La voz soplada
to verify those preliminary results.
de este enfoque subyacen en la idea de si se ofreciera una descripción detalla- se relaciona con el ruido originado por
que quizás sea una manera de evaluar da y se la independizara de la lengua o las turbulencias creadas por una fun-
Key words: Voice disorders, Acoustic las características de la voz que de otro idioma. Lamentablemente, la selección cionalidad insuficiente de la glotis. La
voice analysis, GRBAS, Perceptual voice modo sería difícil medir (Kreiman et al., y la definición de estas escalas han sido modalidad de la vibración de las cuerdas
analysis. 1993). controvertidas y no siempre comunes a vocales sería ineficiente y se acompaña-
Sin embargo, las voces patológi- todos los especialistas en voz. La estan- ría con una fricción audible. Esta fric-
cas han sido clasificadas y descriptas darización de estas escalas es una nece- ción podría deberse a la turbulencia en
Cuando se intenta detectar y caracteri- con diferentes términos y/o escalas que sidad sentida en el área. Un prerequisito el flujo de aire. Los posibles indicadores
zar las voces patológicas en la clínica, denotan su impresión perceptual: ron- parecería ser la definición cuantitativa de esta característica serían las medidas
el objetivo es documentar los cambios quera, aspereza, soplo, etc. Diferentes de las escalas basada en los correlatos de perturbación de la frecuencia y los
significativos de la voz, es decir, aque- escalas han sido introducidas para eva- acústicos y fisiológicos. parámetros de energía espectral (como
llos que no resulten despreciables ni luar las voces patológicas y algunos Varios estudios han correlaciona- GNE, Glottal to Noise Energy Ratio).
producto del azar. Estos cambios pueden especialistas han comenzado a usarlas. do características acústicas y calida- La impresión auditiva de astenia se aso-
documentarse a través de la evaluación La percepción puede evaluar la voz des perceptuales en voces patológi- ciaría a debilidad en la fonación espon-
auditivo perceptual y el análisis acústico desde una perspectiva más estrecha a cas (Dejonckere, Obbens, de Moor & tánea, voz hipocinética o hipofuncional
de la señal. otra más amplia. Si se define la voz en Wienke, 1993; de Krom, 1995; Eske- y por lo contrario, la impresión auditiva
La popularidad de las escalas per- términos acotados, la evaluación per- nazi, Childers & Hicks, 1990; Ham- de excesivo esfuerzo con tensión en la
ceptivo-auditivas surge de múltiples ceptual también intentará reflejarlo, y marberg, Fritzell, Gauffin & Sundberg, fonación espontánea. Una combinación
factores, pero, sin lugar a dudas, uno de supondrá escalas de evaluación percep- 1986; Hammarberg, Fritzell, Gauffin, de la voz áspera y soplada generaría la
los puntos importantes es que la voz es tual centradas en la fuente glótica, es Sundberg, & Wedin, 1980; Kreiman, voz ronca (hoarseness), con un flujo de
en su naturaleza perceptual (Kreiman, decir, sólo en el sonido producido por Gerratt & Berke, 1994; Kreiman, Ger- aire no modulado debido a un cierre gló-
Gerratt, & Berke, 1994) y que existen las cuerdas vocales. Sin embargo, otras ratt, Precoda & Berke, 1992; Murry, tico ausente o incompleto, o irregulari-
limitaciones en la medición instrumen- incluirán la influencia del tracto vocal Singh & Sargent, 1977; Rammage, Pep- dades en la fonación concernientes a la
tal de la voz. Desde este enfoque, la voz que se extiende desde las cuerdas voca- pard & Bless, 1992); o bajo condiciones frecuencia, amplitud o fase. Los princi-
es fundamentalmente un fenómeno de les a los labios. Perspectivas más globa- fisiológicas de la glotis (Hirano, Hibi, pales predictores serían los mismos que
percepción en respuesta a un estímu- les y cuestionamientos más sutiles dirán Terasawa & Fujiu, 1986; Rammage et para la aspereza y voz soplada, es decir
lo acústico. Es por esto que la evalua- que es necesario definir un modelo de al., 1992). Algunas de las correlaciones los parámetros de perturbación de la
ción perceptivo auditiva se convierte en percepción de la voz humana patológi- asocian la aspereza con la impresión de amplitud (shimmer) y frecuencia (jitter).

Revista de Psicología. Año 2012. Vol. 8. Nº 16, pp. 45-61 Revista de Psicología. Año 2012. Vol. 8. Nº 16, pp. 45-61
48 Evaluación perceptivo auditiva de voces degradas y su correlación con medidas acústicas Evaluación perceptivo auditiva de voces degradadas y su correlación con medidas acústicas 49

Resumiendo, los resultados son la necesidad de puntuación de estímulos mentada robustez en la selección del todos los rangos de los datos varían con-
usualmente ambiguos, y a veces hasta para realizar nuestro experimento y las GNE (Michaelis, Froehlich, & Werner junta y significativamente (p < 0,01) con
contradictorios, las co-variaciones de las restricciones de fatiga y habituación que Strube, 1998) y la curiosidad sobre la las respuestas dadas.
medidas acústicas así como las interac- impone el sistema auditivo, sumado a la influencia de LE (Giovanni, Ouaknine, Con el propósito de identificar las
ciones son temas aún irresueltos. condición de iteración de cada muestra & Triglia, 1999). características (variables) que diferen-
En este trabajo se estudia el grado de para constatar la consistencia de las res- cian a dos o más grupos, y determinar
acuerdo entre los oyentes para puntuar puestas. En el Anexo se detallan cada cuántas de ellas son necesarias para
perceptualmente una muestra de voces una de las señales utilizadas. Resultados y discusión lograr la mejor clasificación posible, se
seleccionadas y se calculan las correla- realizó un estudio empleando análisis
ciones para un grupo de medidas acústi- En relación al panel de jueces lo que discriminante. A través de esta técnica
cas de aperiodicidad (6 medidas diferen- Métodos se pudo observar es que ofrecen una es posible buscar una o más funciones,
tes de perturbación de la frecuencia o jit- respuesta psicofísica más acertada a conformadas por combinaciones linea-
ter, a saber:jitter_cc (ANAGRAF) y jit, Un panel de 10 oyentes entrenados, resi- medida que aumenta la magnitud de la les de las variables, que permitan sepa-
jitta, RAP, PPQ, DDP (PRAAT); 3 medi- dentes en el área de fonoaudiología del degradación espectral de la señal Esto rar las instancias suministradas según las
das de ruido (harmonics-to-noise_ratio Hospital de Clínicas José de San Martín, es, a medida que el componente de ruido identidades de clases correspondientes.
(ANAGRAF), HNR (PRAAT)y GNE y puntuó el corpus. Se solicitó que utili- aumenta, aumenta el acuerdo aparente Una vez obtenido el conjunto de funcio-
una medida de caos implementada ad- zaran la escala perceptual que tradicio- entre los jueces. Ver Figura 1. nes discriminantes es posible emplearlas
hoc para este estudio(LE). El objetivo nalmente usan en la clínica diaria, la Es importante resaltar que se espe- para predecir la identidad de clase de
es determinar utilizando las mediciones GRBAS (Hirano, 1981). Se analizó sólo raba mayor acuerdo o consenso en los nuevos ejemplos.
acústicas, qué información es más rele- el ítem G: grado general de la ronquera extremos (anchors) del continuo y varia- En primer lugar conviene resaltar que
vante para el oyente al momento de cate- o disfonía. Posteriormente se correlacio- ciones en los intermedios pero esto no a partir de los análisis llevados a cabo
gorizar la calidad vocal. nó un grupo de medidas acústicas con el ocurrió en la puntuación 0 caracteri- en la etapa de estudio de correlaciones
puntaje perceptual. zación de voces normales (G0). Una entre variables, se había observado que
Para analizar acústicamente las seña- posible respuesta es que el panel estuvo si bien las clases de los datos del proble-
Materiales y método les se empleó la funcionalidad del Voice compuesto por especialistas que evalúan ma en cuestión se solapaban en distintos
Report de PRAAT “Doing phonetics by y buscan detectar la patología vocal. La grados, tal solapamiento no era comple-
Fueron evaluadas 194 muestras de una computer”, de acceso público y gratui- tendencia del panel fue estimar los gra- to, lo que sugiere que existen diferencias
base de datos (Elisei, 2011). Se seleccio- to, disponible en Internet (Boersma & dos de disfonía o ronquera partiendo entre las clases, y genera expectativas
naron 40 muestras pasibles de represen- Weenink, 1996) y de ANAGRAF ver- siempre de una leve base patológica y respecto de los resultados de la apli-
tar las 5 cualidades de la GRBAS en sus sión V09.10 (Gurlekian, 2001) con la desestimando la presencia de voces nor- cación del análisis discriminante. En
4 niveles 0 al 3. Se generaron los espec- función de reporte desarrollado ad-hoc males en la secuencia aleatoria a pesar primer lugar se realizó un análisis de
trogramas de banda estrecha para la tota- en el Laboratorio de Investigaciones de ser advertidos en la consigna. ANOVA univariado para determinar si
lidad de las muestras seleccionadas y se Sensoriales. Los criterios para la selec- Se analizó estadísticamente la con- existía alguna variable no significativa,
tipificaron según la clasificación de seña- ción de las medidas acústicas fueron tribución de varios parámetros medidos el resultado de dicha prueba se presenta
les de Titze (Titze, 1995). Finalmente se variados. Prevaleció la tradición en acústicamente con los perceptualmen- en la Tabla 1.
eligieron 8 (4 voces femeninas y 4 voces medidas como jitter_cc, harmonics-to- te puntuados por los oyentes, y lo que Esta prueba brinda estadísticos F
masculinas). Esta reducción fue una noise_ratio (ANAGRAF) jit, jitta, RAP, muestran los coeficientes de correlación que permiten contrastar la hipótesis de
decisión comprometida y sopesada entre PPQ, DDP y HNR (PRAAT); la docu- de Spearman (Spearman’s rho) es que igualdad de medias entre los grupos en

Revista de Psicología. Año 2012. Vol. 8. Nº 16, pp. 45-61 Revista de Psicología. Año 2012. Vol. 8. Nº 16, pp. 45-61
50 Evaluación perceptivo auditiva de voces degradas y su correlación con medidas acústicas Evaluación perceptivo auditiva de voces degradadas y su correlación con medidas acústicas 51

cada variable independiente. Se puede se deba a que la varianza de las mismas profesionales empleando como observa- en la Tabla 6. Estos son vectores cuyos
ver que si se adopta el umbral de 0,05 fueron completamente explicadas por ciones las medidas acústicas, mientras valores se basan en las diez variables:
como límite para aceptar dicha hipóte- las demás variables, es decir que las mis- que en el caso de clustering, se emplea Jitter_cc (ANAGRAF), harmonics-to-
sis, en ningún caso se debería aceptar la mas fueron variables redundantes. En k-means para tratar de detectar si existen noise ratio (ANAGRAF), GNE, Lyapu-
hipótesis de medias iguales. el proceso de cálculo se dispuso que el grupos de pacientes que se puedan iden- nov (ad-hoc), Jit, Jitta, RAP, PPQ, DDP
La Tabla 2 permite comparar de algoritmo estime las probabilidades ini- tificar según las similitudes de sus medi- y HNR (PRAAT) estandarizadas.
manera global la capacidad discriminan- ciales de las clases a partir de los tama- ciones acústicas, sin considerar las cla- En la Tabla 7 se muestran los centros
te de cada función. Por ejemplo en este ños de cada clase de acuerdo a los datos ses perceptuales. El algoritmo k-means finales de los conglomerados. Se puede
caso la función 1 explica el 77,7% de las presentados. En la Tabla se presenta los parte definiendo el número k de grupos ver que el conglomerado 1 contiene los
diferencias existentes entre los sujetos resultados de la clasificación obtenidos en que se dividirá el conjunto de datos menores valores para las medidas de per-
de los grupos, mientras que la segun- mediante esta técnica utilizando valida- disponibles. El algoritmo posteriormen- turbaciones en frecuencia y las mayores
da función logra explicar un 21,9% de ción cruzada (opción 1 de N). El clasifi- te genera hipotéticos centros para los relaciones señal a ruido: harmonics-to-
dichas diferencias y la tercera un 0,4%. cador arrojó tasas de reconocimiento de k grupos, conocidos como centros ini- noise ratio (ANAGRAF). Se los podría
En la Tabla 3 se brinda el detalle de grado de la disfonía (G de GRBAS) rela- ciales de los clústeres. Posteriormente asociar con las voces normales. El clús-
los coeficientes estandarizados de la tivamente buenas para todos los puntajes compara la distancia de cada ejemplo ter 2 es parecido al 1 pero con mayores
función canónica discriminante. En esa excepto para el 1 en cuyo caso la mitad disponible respecto a esos centros y niveles de perturbación y menor HNR.
tabla se puede comparar la importancia de los casos se confunden con la clase 0 los asocia al clúster con el centro más El clúster 3 tiene los mayores niveles de
de cada variable a la hora de predecir y la otra mitad con la clase 2. cercano. Cuando todos los ejemplos de perturbación (Jit, Jitta, RAP, PPQ, DDP)
el grupo de pertenencia perceptual. Se A partir de los resultados anteriores entrada fueron asociados a un clúster se y menores HNR (PRAAT). Se los podría
puede notar que la variable GNE es la se evaluó la posibilidad de que los datos calcula el nuevo centro de cada clúster y asociar con voces más alteradas. El grupo
más importante para todas las funcio- disponibles no estuviesen separados de se itera este proceso hasta que se alcan- 4 tiene el mayor valor de Jitter_cc y el
nes discriminantes, salvo para la prime- manera compatible con las puntuacio- za algún criterio de finalización. Este más alto valor de Lyapunov. Ver Figura 2.
ra, mientras que Jit es importante en la nes perceptuales, sino de acuerdo a otro algoritmo finalmente ofrece el valor de Los centros finales obtenidos a través
primera, y segunda en importancia en ordenamiento. Para ello, se experimentó los centros finales, que se pueden con- del procedimiento anterior se pueden
la segunda y tercera funciones discrimi- con un algoritmo de clustering o agru- siderar como los elementos prototípi- emplear para clasificar nuevos casos.
nantes. pamiento, específicamente K-means. A cos de cada grupo, y quedan definidos Para ello se debe calcular la distancia
En la Tabla se presentan los coefi- diferencia de la tarea de clasificación en coordenadas respecto a las variables de la nueva instancia respecto a cada
cientes de clasificación de Fisher que llevada a cabo anteriormente a través de de entrada. Finalmente se pueden com- centro y asignarle la identidad de clase
permiten obtener la función de clasifica- la metodología de análisis discriminan- parar las características de los distintos correspondiente al centro más próximo.
ción para cada grupo. Para aplicar estos te, en la tarea de clustering, se buscan centros en términos de sus coordenadas A partir de los resultados obtenidos tras
coeficientes se calcula cada una de las funciones que separen el conjunto de para proponer cuáles son las particula- la aplicación de este método, es posible
funciones para un sujeto, y se lo clasifica datos disponibles a partir de similitudes ridades de cada grupo de datos. Como aseverar que existen rasgos en los pará-
en el grupo para el cual la función obtie- intrínsecas o naturales de los datos, y no este algoritmo necesita que el usuario metros acústicos empleados que per-
ne el mayor valor. Se puede observar que a partir de etiquetas de clases conocidas indique un valor de k, se decidió buscar miten agrupar objetivamente las voces
tanto en la Tabla 3 como en la Tabla 4 no a priori. Es decir, con el análisis discri- igual número de grupos que de valo- estudiadas, y que este mismo procedi-
se muestra las variables Jitta, RAP, PPQ, minante se intentó determinar funciones res en la escala perceptual GRBAS, es miento se puede aplicar para determinar
DDP y HNR. Estas variables no pasaron que permitiesen obtener una puntuación decir 4. Los centros de clúster iniciales la pertenencia de nuevas voces a los gru-
la prueba de tolerancia. Probablemente perceptual similar a la asignada por los estimados por el algoritmo aparecen pos definidos.

Revista de Psicología. Año 2012. Vol. 8. Nº 16, pp. 45-61 Revista de Psicología. Año 2012. Vol. 8. Nº 16, pp. 45-61
52 Evaluación perceptivo auditiva de voces degradas y su correlación con medidas acústicas Evaluación perceptivo auditiva de voces degradadas y su correlación con medidas acústicas 53

Conclusiones hacia la determinación de correlaciones Referencias abnormal voice qualities. Acta Otolaryn-
entre parámetros físicos y perceptuales gol(90), 441-451.
La voz no es un objeto tangible ni un y sugieren que la relación entre medi- Hirano, M. (1981). Clinical Examination of
órgano físico. La voz es un producto das de percepción y acústicas de la voz Boersma, P., & Weenink, D. (1996). Praat: the voice. New York: Springer Verlag.
doing phonetics by computer, 4.6.06. Hirano, M., Hibi, S., Terasawa, R., & Fujiu,
efímero de un sistema muy complejo de sólo pueden ser identificadas integrando
Obtenido de Computer program: http:// M. (1986). Relationship between aero-
conductas que está sujeto a variaciones enfoques perceptuales y acústicos a la www.praat.org dynamic, vibratory, acoustic and psy-
de momento a momento. Las medicio- cualidad o calidad vocal. Sin embargo, de Krom, G. (1995). Some spectral corre- choacoustic correlates in dysphonia.
nes impuestas al fenómeno de la pro- resulta necesario evaluar estos resulta- lates of pathological breathy and rough Journal of Phonetics, 14, 445-456.
ducción vocal, por lo tanto, no son sólo dos con un mayor número y variabilidad voice quality for different types of vowel Kreiman, J., Geratt, B. R., & Kempster,
relaciones entre entidades físicas sino de casos, para poder generalizar estas fragments. J Speech Hear Res, 38, 794- G. B. (1993). Perceptual Evaluation
aspectos del comportamiento. Demos- relaciones. 811. of voice quality: review, tutorial, and a
trar una relación entre la observación Como trabajo futuro, se analizará la Dejonckere, P. H., Obbens, C., de Moor, G. framework for future research. J Speech
de fenómenos acústicos y conductas presencia de ruido aditivo a la señal de M., & Wienke, G. H. (1993). Perceptual Hear Res(36), 21-40.
evaluation of dysphonia: reliability and Kreiman, J., Geratt, B. R., Precoda, K., &
vocales específicas generalmente es un voz, dado que aparentemente esta es una
relavance. Folia Phoniatrica(45), 76-83. Berke, G. S. (1992). Individual diferen-
proceso problemático. Individualmen- de las características que mayormente Elisei, N. G. (2011). Evaluación acústica y ces in voice quality perception. J Speech
te, tanto la evaluación perceptual como relevaron los oyentes durante las evalua- perceptual de la voz para la detección y Hear Res(35), 512-520.
la acústica han mostrado tener sus limi- ciones perceptuales de este trabajo. caracterización de los desórdenes voca- Kreiman, J., Gerratt, B. R., & Berke, G. S.
taciones. La tendencia es investigar si Es por esto que se refuerza la hipóte- les. Tesis doctoral, Universidad de Bue- (1994). The multidimensional nature
las dos pruebas se pueden correlacio- sis de una percepción global no desagre- nos Aires, Buenos Aires. of pathologic vocal quality. Journal of
nar, con el propósito de desarrollar una gada sino integradora que podría investi- Eskenazi, L., Childers, D., & Hicks, D. Acoustical Society of America, 96(3),
medida que incorpore las ventajas de garse a través de las técnicas psicofísicas (1990). Acoustic Correlates of Vocal 1291-1302.
ambos. El análisis acústico representa de producción de la magnitud más que Quality. J. Speech Hear. Res., 33, 298- Michaelis, D., Froehlich, M., & Werner Stru-
306. be, H. (1998). Selection and combination
sólo una parte de la evaluación de la de estimación.
Giovanni, A., Ouaknine, M., & Triglia, J. M. of acoustic features for the description of
calidad vocal, y el análisis de la percep- Esto es, modelando la calidad como
(1999). Determination of largest Lyapu- pathologic voices. J. Acoust. Soc. Am.,
ción puede complementar y fundamen- una función de una señal particular y un nov exponents of vocal signal: applica- 3(103), 1628-1639.
tar la medida. oyente específico. Por eso, el análisis tion to unilateral laryngeal paralysis. J. Murry, T., Singh, S., & Sargent, M. (1977).
Los resultados mostraron una signi- por síntesis puede proveer un signifi- Voice(13), 341-354. Multidimensional classification of
ficativa correlación entre los parámetros cado alternativo al modelar la cualidad Gurlekian, J. A. (2001). La percepción abnormal voice qualities. J. Acoust. Soc.
de ruido y de percepción del grado G. vocal como función de ambos, voz y auditiva. En ICCE, Bustos, & San- Am., 61, 1630-1635.
Estos análisis proporcionaron informa- oyente. Se lograría así independizar al chez (Edits.), La percepción auditiva: Nawka, T., Anders, L. C., Cebulla, M., &
ción acerca de la importancia de tres oyente de su patrón interno sugiriéndo- un enfoque transversal (págs. 51-90). Zurakowski, D. (1997). The speaker’s
parámetros como predictores: GNE que le producir por equiparación, manipu- Madrid: CEPE. formant in male voices. J Voice(11), 422-
Hammarberg, B., Fritzell, B., Gauffin, J., & 428.
mide la proporción de energía de fuente lando un sintetizador, la percepción de
Sundberg, J. (1986). Acoustic and per- Rammage, L. A., Peppard, R. C., & Bless,
glótica y/o por turbulencia, Jit y Jitter_ un estímulo target a uno nuevo sinteti- ceptual analysis of vocal dysfunction. J D. M. (1992). Aerodynamic, Laryngos-
cc mide la aperiodicidad y Lyapunov el zado. Phonetics(14), 533-547. copic, and Perceptual-Acoustic Charac-
caos de la señal. Hammarberg, B., Fritzell, B., Gauffin, teristics in Dysphonic Females with Pos-
Los análisis efectuados en este traba- J., Sundberg, J., & Wedin, L. (1980). terior Glottal Chinks: A Retrospective
jo constituyen un primer acercamiento Perceptual and acoustic correlates of Study. Journal of Voice, 6, 64-78.

Revista de Psicología. Año 2012. Vol. 8. Nº 16, pp. 45-61 Revista de Psicología. Año 2012. Vol. 8. Nº 16, pp. 45-61
54 Evaluación perceptivo auditiva de voces degradas y su correlación con medidas acústicas Evaluación perceptivo auditiva de voces degradadas y su correlación con medidas acústicas 55

Titze, I. R. (1995). Workshop on acous- Heyning, P. H. (1999). Is the reliability Tabla 1.


tic voice analysis; Summary statement. of a visual analog scale higher than an Análisis de ANOVA univariado
National Center for Voice and Speech, ordinal scale? An experiment with the
Denver, Colorado, Estados Unidos. GRBAS scale for the perceptual evalua-
  Wilks’ Lambda F df1 df2 Sig.
Wuyts, F. L., De Bodt, M. S., & Van de tion of dysphonia. J Voice, 13, 508-517.
Jitter_cc ,963 1,655 3 129 ,180
Harmonics-to- Noise Ratio ,562 33,463 3 129 ,000
Glottal Noise Energy ,432 56,533 3 129 ,000
Lyapunov ,830 8,779 3 129 ,000
Jit ,275 113,417 3 129 ,000
Jitta ,275 113,367 3 129 ,000
RAP ,276 112,540 3 129 ,000
PPQ ,277 112,213 3 129 ,000
DDP ,277 112,502 3 129 ,000
HNR ,294 103,427 3 129 ,000

Tabla 2.
Autovalores de la Función Discriminantes

Función Autovalor % de Varianza % Acumulado Canonical Correlation

1 2,868 77,7 77,7 ,861


2 ,810 21,9 99,6 ,669
Figura 1: Las respuestas (EAI) del panel de jueces a los estímulos presentadas.
La señal va aumentando su grado de alteración de 0: normal a 3: 3 ,015 ,4 100,0 ,123
severo replicando la escala GRBAS
Tabla 3.
Coeficientes estandarizados de las funciones discriminantes canónicas

  Función
  1 2 3
Jitter_cc ,017 ,198 ,025
Harmonics to Noise_Ratio -,368 -,982 -,373
Glottal Noise Energy 2,385 6,679 2,640
Lyapunov 1,385 4,092 ,581
Jit 2,778 4,861 1,780

Revista de Psicología. Año 2012. Vol. 8. Nº 16, pp. 45-61 Revista de Psicología. Año 2012. Vol. 8. Nº 16, pp. 45-61
56 Evaluación perceptivo auditiva de voces degradas y su correlación con medidas acústicas Evaluación perceptivo auditiva de voces degradadas y su correlación con medidas acústicas 57

Tabla 4. Tabla 6.
Coeficientes de la función de clasificación Centros iniciales de los conglomerados

  Puntaje   Clúster
  0 1 2 3   1 2 3 4
Jitter_cc 5,124 5,355 5,658 5,443 Jitter_cc -1,7797 -1,2990 ,24436 1,47990
Harmonics to Noise_Ratio ,492 -1,552 -4,677 -4,307 Harmonics-to-noise_ratio 2,07226 ,48666 -,66596 ,34631
Glottal Noise Energy 137,924 156,869 186,026 181,686 Gne 1,20094 ,97350 -,91203 ,37540
Lyapunov 38,423 44,357 52,449 51,001 Lyapunov -,77150 -,71745 -,58784 1,47904
Jit 97,331 110,743 131,274 135,194 Jit -,66503 -,24617 2,15903 -,43530
(Constant) -30,369 -36,094 -48,424 -50,796 Jitta -,65795 -,21377 2,15595 -,41933
RAP -,65982 -,27164 2,16113 -,42000
PPQ -,63303 -,26628 2,16344 -,45243
Tabla 5. DDP -,65906 -,27222 2,16126 -,41991
Resultados de la clasificación
HNR 1,39738 -,13960 -1,8027 ,20275

  Grupo de pertenencia pronosticado


Puntaje Total
    0 1 2 3 Tabla 7.
0 7 0 0 0 7 Centros de los conglomerados finales
1 23 0 20 0 43
Count
2 1 0 53 1 55   Cluster
3 0 0 6 22 28   1 2 3 4
Original
0 100,0 ,0 ,0 ,0 100,0 Jitter_cc -1,7797 -,79742 ,24436 ,93341
1 53,5 ,0 46,5 ,0 100,0 Harmonics to Noise Ratio 2,07226 ,63417 -,66596 ,01745
%
2 1,8 ,0 96,4 1,8 100,0 Glottal Noise Energy 1,20094 ,98009 -,91203 ,33792
3 ,0 ,0 21,4 78,6 100,0
Lyapunov -,77150 -,70984 -,58784 1,51739
0 7 0 0 0 7
Jit -,66503 -,37015 2,15903 -,44002
1 23 0 20 0 43
Count Jitta -,65795 -,34156 2,15595 -,46310
2 1 0 53 1 55
RAP -,65982 -,38921 2,16113 -,42809
Cross- 3 0 0 6 22 28
PPQ -,63303 -,37735 2,16344 -,44752
validated 0 100,0 ,0 ,0 ,0 100,0
DDP -,65906 -,38936 2,16126 -,42830
1 53,5 ,0 46,5 ,0 100,0
% HNR 1,39738 ,31097 -1,8027 ,07447
2 1,8 ,0 96,4 1,8 100,0
3 ,0 ,0 21,4 78,6 100,0

Revista de Psicología. Año 2012. Vol. 8. Nº 16, pp. 45-61 Revista de Psicología. Año 2012. Vol. 8. Nº 16, pp. 45-61
58 Evaluación perceptivo auditiva de voces degradas y su correlación con medidas acústicas Evaluación perceptivo auditiva de voces degradadas y su correlación con medidas acústicas 59

Anexo 1.
jitter_cc Estímulos utilizados en el test perceptual. Para la selección se siguió los criterios
10,00000
harmonics-tc- de tipificación de señales de Titze (Titze, 1995) y la modificación de (Sprecher,
HNR noise_ratio Olszewski, Jiang, & Zhang, 2010).
1,00000

DDP ,10000 gne 1


2
3
PPQ lyapunov 4

FAP jit

jitta

Figura 2. Representación radial del log 10 de las distancias


medidas a los centros de los clúster

Hablantes femeninos. Tipos de señales, de izquierda a derecha: 1, 2, 3 y 4.

Revista de Psicología. Año 2012. Vol. 8. Nº 16, pp. 45-61 Revista de Psicología. Año 2012. Vol. 8. Nº 16, pp. 45-61
60 Evaluación perceptivo auditiva de voces degradas y su correlación con medidas acústicas Evaluación perceptivo auditiva de voces degradadas y su correlación con medidas acústicas 61

Anexo 2.
Glosario de medidas acústicas

Medida
Sistema Definición técnica
acústica
Diferencia absoluta media entre dos períodos consecutivos, dividido
jitt
por el período promedio.
jitta Diferencia absoluta media entre dos períodos consecutivos.
Perturbación relativa media: la diferencia absoluta media entre un
jitter_RAP período y el promedio de la misma y sus dos vecinos, dividido por el
período promedio.
PRAAT Cociente perturbación del período de cinco puntos: la diferencia abso-
jitter_PPQ luta media entre un período y el promedio de ella y sus cuatro vecinos
más cercanos, dividido por el período promedio.
Diferencia absoluta media entre diferencias consecutivas entre dos
jitter_DDP períodos consecutivos, dividido por el período promedio. El valor es
tres veces RAP.
Relación entre la potencia de la señal y la potencia de ruido que
HNR
corrompe la señal
Requiere coincidir con Jitter_pr para que la medición sea válida. La
Jitter_cc
validez depende si la diferencia es de hasta 3 ciclos, hasta 5 ciclos o
Hablantes masculinos. Tipos de señales, de izquierda a derecha: 1, 2, 3 y 4. (ANAGRAF)
hasta 10 ciclos.
ANAGRAF
harmonic-to-
noise_ratio Adaptación del algoritmo de Eiji Yumoto
(ANAGRAF)
Glottal to
Michaelis noise Energy Proporción de excitación glótica/ ruido
ratio GNE
Lyapunov Algoritmo de algoritmo de Wolf con las simplificaciones y parámetros
Evin
coeficients sugeridos por Giovanni

Revista de Psicología. Año 2012. Vol. 8. Nº 16, pp. 45-61 Revista de Psicología. Año 2012. Vol. 8. Nº 16, pp. 45-61

You might also like