You are on page 1of 16

Comparacin de perfiles sensoriales de productos generados por

panelistas entrenados y consumidores utilizando preguntas CATA:


Cuatro casos prcticos con muestras complejas y/o similares
Gastn Ares a, Luca Antnez a, Fernanda Bruzzone a, Leticia Vidal a, Ana Gimnez a, Benedicte Pineau b,
Michelle K. Beresford b, David Jin b, Amy G. Paisley b, Sok L. Chheang b, Christina M. Roigard b, Sara R. Jaeger
b,
*
Departamento de Ciencia y Tecnologa de Alimentos, Facultad de Qumica, Universidad de la Repblica, Gral. Flores 2124, CP 11800 Montevideo,
Uruguay
b
The New Zealand Institute for Plant & Food Research Ltd., 120 Mt Albert Road, Private Bag 92169, Auckland, New Zealand
a

I NFO RMA CI N DE L ART CULO

RE S UME N

Historia del artculo:


Recibido 23 Marzo 2015
Recibido en forma revisada 22 Mayo 2015
Disponible en lnea 28 Mayo 2015

Investigaciones previas sobre la comparacin de caracterizaciones


sensoriales de productos obtenidas con panelistas entrenados y las
obtenidas con consumidores utilizando preguntas CATA (marque todo lo
que corresponda) han demostrado que los resultados son comparables.
Sin embargo, queda por determinar si el uso de preguntas CATA por los
consumidores para productos complejos (por ejemplo, vino) y en los
casos en que las muestras focales son similares (por ejemplo, diferentes
marcas de vinos blancos Marlborough Sauvignon de Nueva Zelanda)
ofrece caracterizaciones de productos similares a los de panelistas
entrenados utilizando anlisis descriptivo genrico. Se abord esta
cuestin en cuatro estudios. Las categoras de productos fueron vino
blanco, frambuesas, postres lcteos y bebidas en polvo. Los resultados
apoyan los hallazgos anteriores para revelar que los dos mtodos
generan resultados comparables. Sin embargo, las caracterizaciones de
productos fueron menos similares en estudios en los que las muestras
eran ms similares y/o complejas. Por lo tanto, mientras la validez de los
perfiles sensoriales generados por el consumidor a partir de preguntas
CATA es confirmada, este enfoque de caracterizacin sensorial de
productos debe ser implementado con una comprensin de su menor
capacidad para ofrecer caracterizaciones de productos matizadas e
identificar diferencias menores entre muestras similares y/o complejas. A
veces se requieren tales caracterizaciones detalladas de los productos;
otras veces ser suficiente menos detalle. Qu grupo de panelistas y
mtodo a implementar debe, como siempre, estar directamente alineado
con los objetivos del estudio, y en el caso de los consumidores que
utilizan preguntas CATA, tambin debe incluir la consideracin de
capacidad de obtener simultneamente respuestas hednicas?

Palabras clave:
Anlisis sensorial
Perfilamiento descriptivo
Investigacin de consumidores
Preguntas CATA

2015 Elsevier Ltd. Todos los derechos reservados

1. Introduccin
La caracterizacin de productos es una actividad
fundamental para los cientficos sensoriales.
Tradicionalmente el anlisis descriptivo (DA) con
panelistas entrenados se ha utilizado para este
trabajo, y los protocolos establecidos se deben
cumplir cuidadosamente (Lawless y Heymann,
2010). El deseo de tener acceso a los mtodos
rpidos y/o descripciones sensoriales de productos
generados por los consumidores ha provocado el
desarrollo metodolgico en relacin con la
caracterizacin sensorial del producto (Valentin,
Chollet, Lelivre, y Abdi, 2012; Varela y Ares, 2012).
Numerosos enfoques ahora existen y cientficos
sensoriales se enfrentan cada vez a la necesidad de
decidir el mtodo a utilizar para lograr los objetivos
especificados (Ares y Varela, 2014). Para facilitar
dicha toma de decisiones, se necesitan puntos de
vista con respecto a los pros y los contras de los
diferentes mtodos de caracterizacin sensorial de
productos.
Teniendo en cuenta que las metodologas rpidas no
pueden ser considerados como la sustitucin del DA
clsico con panelistas entrenados (Varela y Ares,
2012), es necesario establecer claramente en qu
situaciones estas metodologas proporcionan
informacin similar a la DA y en qu situaciones no
se recomienda su aplicacin. Estudios anteriores
que comparan caracterizaciones sensoriales
obtenidas usando DA con panelistas entrenados y
por consumidores que utilizan una gama de
diferentes mtodos han mostrado un buen acuerdo
(Albert, Varela, Salvador, Hough, y Fiszman, 2011;
Ares, Bruzzone, y Gimnez, 2011; Dairou y
Sieffermann, 2002; Dehlholm, Brockhoff, Meinert,
Aaslyng, y Bredie, 2012; Lawless, Sheng, y Knoops,
1995; Moussaoui y Varela, 2010; Symoneaux,
Galmarini, y Mehinagic, 2012). Sin embargo, muchos
de los estudios se han realizado con muestras que
fueron ''simples'' (frente a ''complejas'') en su firma
sensorial y/o conjuntos de muestras donde las
diferencias entre las muestras eran ''grandes'' (vs.
pequeas''). Los estudios que se centran en el

efecto que tienen la complejidad de la muestra y el


grado de diferencia entre las muestras sobre la
capacidad discriminativa de nuevas metodologas
son insuficientes. El presente trabajo aporta un
cierre a esta brecha de conocimiento.
Las preguntas CATA (marque todo lo que
corresponda) son algunos de los enfoques rpidos
recientemente introducidos para el anlisis sensorial
(Meyners y Castura, 2014). Para cada muestra, se
presenta una lista predefinida de descriptores
sensoriales y los participantes son instruidos para
seleccionar todo lo que corresponda. Las preguntas
CATA son fciles de implementar y los consumidores
las consideran fciles y no tediosas para completar
(Ares et al, 2014; Jaeger y Ares, 2014; Jaeger et al,
2013). En la investigacin hasta la fecha, las
caracterizaciones de productos generados por
panelistas entrenados y consumidores que utilizan
preguntas CATA han sido similares (Ares, Barreiro,
Deliza, Gimnez, y Gmbaro, 2010; Bruzzone, Ares,
y Gimnez, 2012; Dooley, Lee, y Meullenet de 2010).
Con un enfoque en las muestras que son
complejas y/o similares, la presente investigacin
extiende estas comparaciones previas de
caracterizaciones sensoriales de productos
generados
por
panelistas
entrenados
y
consumidores que utilizan preguntas CATA. El
trabajo emprico que comprende cuatro estudios se
resume en la Tabla 1. Para aumentar la
generalizacin de la investigacin, se incluyeron
diferentes categoras de productos: postres lcteos
(Estudio 1), bebidas en polvo (Estudio 2), coulis de
frambuesa (Estudio 3) y vino blanco (Estudio 4). Por
otra parte, en el Estudio 1 y 2, dos conjuntos de
muestras con diferencias pequeas y medianas,
respectivamente, se incluyeron para dar una idea de
la magnitud de las diferencias entre las muestras.
2. Materiales y mtodos
Los detalles relativos a los materiales y mtodos se
presentan estudio por estudio (Seccin 2.1
Seccin 2.5). Las restricciones de longitud
requirieron que algunos aspectos menores de

implementacin emprica queden fuera, y los


lectores interesados pueden ponerse en contacto
con los autores para obtener ms informacin. El
anlisis de datos fue similar en todos los estudios y
los detalles se dan en la Seccin 2.5.
2.1. Estudio 1a y 1b (postres lcteos)
Los estudios 1a y 1b eran idnticos en todos los
aspectos a excepcin de los grupos de muestras
que estaban siendo evaluados. En el Estudio 1a los
postres lcteos se formularon para crear un conjunto
de estmulos en que el grado de diferencias entre las
muestras fuera pequeo, segn lo determinado por
los investigadores en funcin de su experiencia
previa con la categora de producto. Por el contrario,
en el Estudio 1b, las diferencias de las muestras
eran medias. El Estudio 1a incluy siete muestras,
mientras que el Estudio 1b incluy nueve muestras
(Tabla 1).
2.1.1. Las muestras
Dos conjuntos de postres de leche con sabor a
vainilla con diferentes caractersticas de textura y
sabor se formularon variando el tipo y concentracin
de almidn modificado, carragenina, sabor de
vainilla y sucralosa. Se seleccionaron las
formulaciones en base a estudios preliminares con el
fin de obtener muestras con diferentes grados de
diferencia (Vidal et al., 2014).
Los postres se prepararon en agua de cao, usando
12% de leche entera en polvo (Conaprole,
Montevideo, Uruguay), 3% de azcar comercial
(Bella Unin, Uruguay), almidn modificado (Purity
HPC, de National Starch and Chemical Company;
Bridgewater, NJ, EE.UU.), 5% de inulina (Frutafit IQ,
Sensus, Pases Bajos), aroma de vainilla (Symrise,
Alemania), carragenina (TIC sometidas a pruebas
previas coloide 710 H en polvo, TIC Gums, Belcamp,
MD), sucralosa (e Ingredientes sabores, Uruguay),
0,1% de sodio tripolifosfato y colorante amarillo. El
resto de la formulacin (hasta 100%) era agua. Las
muestras se prepararon mezclando los ingredientes
slidos con agua y se vertieron en un Thermomix TM

31 (Vorwerk Mexico S. de R. L. de C.V., Mxico D.


F., Mxico). La dispersin se calent a 90 C durante
5 min con agitacin fuerte (100 rpm). Los postres se
colocaron en recipientes de vidrio, cerrados, se
enfri a temperatura ambiente (25 C) y luego se
refriger (4-5 C) durante 24 h antes de la evaluacin.
2.1.2. Evaluaciones del panel entrenado
El panel sensorial estuvo compuesto por 10
panelistas (70% mujeres; 20 a 49 aos de edad).
Los panelistas tenan un mnimo de 200 h
experiencia en el anlisis descriptivo genrico de
diferentes productos alimenticios y al menos 10 h de
experiencia en el anlisis descriptivo de productos
lcteos.
El anlisis descriptivo genrico (Lawless y Heymann,
2010) se utiliz para la caracterizacin sensorial de
las muestras de postres de leche. En una primera
sesin, a los panelistas se les present cuatro
muestras de postres lcteos, que representan una
amplia gama de caractersticas sensoriales. Se les
pidi que generen sus descriptores individuales.
Luego, a travs de la discusin con el lder del panel,
los panelistas se pusieron de acuerdo para definir
los mejores descriptores, sus definiciones y cmo
evaluarlos. La lista final consisti de nueve
descriptores (Tabla 2). En sesiones sucesivas, los
panelistas fueron entrenados en la cuantificacin de
los descriptores seleccionados utilizando escalas no
estructuradas. Un total de doce sesiones de 15
minutos en das separados fueron utilizadas para
entrenar el panel.
Despus de la fase de entrenamiento, las muestras
se evaluaron utilizando escalas lineales no
estructuradas de 10 cm anclados con "baja" a la
izquierda y "alto" a la derecha. Las muestras fueron
codificadas utilizando nmeros aleatorios de 3
dgitos y presentadas siguiendo un diseo cuadrado
latino de Williams. Dos repeticiones de cada muestra
se evaluaron por cada panelista.
Las pruebas se efectuaron en un laboratorio
sensorial en cabinas sensoriales estndar que

fueron diseadas de acuerdo con la norma ISO 8589


(ISO, 2007), bajo luz artificial y control de
temperatura (22 C). Se utiliz agua mineral sin gas
para el enjuague entre las muestras. Los datos
fueron recolectados a travs de cdulas de votacin.
2.1.3. Evaluaciones del panel de consumidores
Las evaluaciones realizadas por los consumidores
se llevaron a cabo en Montevideo (Uruguay) con 199
participantes (71% mujeres; 18-52 aos). Los
participantes fueron reclutados de la base de datos
del consumidor del Departamento de Ciencia y
Tecnologa de los Alimentos de la Universidad de la
Repblica (Uruguay), en funcin de su consumo del
producto focal. Los participantes dieron su
consentimiento informado y recibieron un pequeo
obsequio por su participacin.
Los consumidores se dividieron en dos grupos de
tamao similar; cada uno evalu un conjunto de
muestras diferentes (Tabla 1). Se les pidi que
prueben cada uno de los postres lcteos y
respondan una pregunta CATA con 18 trminos
(Tabla 2). Se seleccionaron los trminos en base a
estudios previos con otros consumidores. Los
trminos fueron presentados en un orden diferente
para cada producto y cada participante de acuerdo a
las recomendaciones (Ares et al., 2014), siguiendo
un diseo equilibrado para el orden de presentacin
(cuadrado latino de Williams). Se obtuvieron
respuestas hednicas pero los datos no se analizan
en el presente trabajo.
Las muestras (20 g) se presentaron a 10C en
recipientes de plstico de 50 ml libres de olores
marcados con cdigos aleatorios de 3 dgitos. Las
muestras fueron evaluadas en secuencia mondica,
siguiendo un diseo equilibrado para la orden de
presentacin y efectos de arrastre (diseo de
Williams). El agua mineral sin gas estaba disponible
para el lavado (opcional). Los panelistas fueron
colocados en cabinas sensoriales normales, con
condiciones controladas de flujo de aire y
temperatura (21-23C). Los datos fueron
recolectados a travs de cdulas de votacin.

2.2. Estudio 2a a 2d (bebidas de naranja en polvo)


Los estudios 2a hasta 2d eran idnticos en todos los
aspectos, excepto para los grupos de muestras que
se est evaluando. En los estudios 2a y 2c las
muestras de bebidas en polvo fueron seleccionados
para crear un conjunto de estmulos en que el grado
de diferencias entre las muestras fuera pequeo,
segn lo determinado por los investigadores en
funcin de su experiencia previa con la categora del
producto. Por el contrario, en los estudios 2b y 2d,
las diferencias de las muestras eran medias. Los
estudios 2a y 2b incluyeron seis muestras, mientras
que los estudios 2c y 2d incluyeron nueve muestras.
2.2.1. Las muestras
Se utilizaron dieciocho muestras comerciales de
bebidas en polvo con sabor a naranja, todas ellas
disponibles en el mercado de Uruguay. Las muestras
se prepararon por dilucin de los polvos con agua de
cao, como se explica en el paquete. Se
almacenaron en un refrigerador a 10C hasta que
fueron servidos a los consumidores, dentro de las 4
h.
2.2.2. Evaluaciones del panel entrenado
El panel sensorial constaba de 11 panelistas (64%
mujeres; 23-48 aos). Los panelistas haban sido
seleccionados y entrenados de acuerdo a las
directrices de la norma ISO 8586: 2012 estndar
(ISO, 2012).
Las bebidas en polvo de sabor a naranja fueron
evaluadas por el panel entrenado usando anlisis
descriptivo genrico (Lawless y Heymann, 2010). En
una primera sesin, a los panelistas se les present
seis muestras de bebidas en polvo, lo que
representa una amplia gama de caractersticas
sensoriales. Se les pidi que generen sus
descriptores individuales. Luego, a travs de la
discusin con el lder del panel, los panelistas
llegaron a un acuerdo para definir los mejores
descriptores, sus definiciones y cmo evaluarlos. La
lista final consisti en 12 descriptores (Tabla 2). En

sesiones sucesivas, los panelistas fueron


entrenados en la cuantificacin de los descriptores
seleccionados utilizando escalas no estructuradas.
Un total de diecisis sesiones de 15 min en das
separados fueron utilizadas para entrenar el panel.
Despus de la fase de entrenamiento, las muestras
se evaluaron utilizando escalas lineales no
estructuradas de 10 cm anclados con "baja" a la
izquierda y "alto" a la derecha. Las muestras fueron
codificadas utilizando nmeros aleatorios de 3
dgitos y presentadas siguiendo un diseo cuadrado
latino de Williams. Dos repeticiones de cada muestra
se evaluaron por cada panelista.
Las pruebas se efectuaron en un laboratorio
sensorial en cabinas sensoriales estndar que
fueron diseadas de acuerdo con la norma ISO 8589
(ISO 2007), bajo luz artificial y control de
temperatura (22 C). Se utiliz agua mineral sin gas
para el enjuague entre las muestras. Los datos
fueron recolectados usando el software
Compusense-at-hand (Compusense Inc., Guelph,
Canad).
2.2.3. Evaluaciones del panel de consumidores
El estudio se realiz en Montevideo (Uruguay). Un
total de 431 consumidores particip en el estudio
(65% mujeres, 18-52 aos de edad). Fueron
reclutados de la base de datos del consumidor del
Departamento de Ciencia y Tecnologa de los
Alimentos de la Universidad de la Repblica
(Uruguay). Todos los participantes consuman
bebidas con sabor a naranja, al menos de vez en
cuando (una vez al mes). Los participantes dieron su
consentimiento informado y recibieron un pequeo
obsequio por su participacin.
Los consumidores se dividieron aleatoriamente en
cuatro grupos de tamao similar. Cada uno de los
grupos evalu un conjunto de muestras diferentes
(Tabla 1). Se pidi a los consumidores que prueben
cada una de las bebidas y respondan a una
pregunta CATA con 16 trminos (Tabla 2). Se
seleccionaron los trminos en base a estudios

previos con otros consumidores. Los trminos se


presentan en orden diferente para cada producto y
cada participante de acuerdo a las recomendaciones
(Ares et al., 2014), siguiendo un diseo equilibrado
para el orden de presentacin (cuadrado latino de
Williams). Se obtuvieron respuestas hednicas pero
los datos no se analizan en el presente trabajo.
Las muestras (30 ml) se presentaron a 10C en
recipientes de plstico de 60 mL libres de olores
marcados con cdigos aleatorios de 3 dgitos. El
orden de presentacin fue mondico, de acuerdo
con los diseos que fueron equilibrados para el
orden de presentacin y los efectos de arrastre
(diseo de Williams). Estuvo disponible agua mineral
sin gas para el lavado (opcional). Los panelistas
fueron colocados en cabinas sensoriales normales,
con condiciones controladas de flujo de aire y
temperatura (21-23C). Los datos fueron
recolectados usando el software Compusense-athand (Compusense Inc., Guelph, Canad).
2.3. Estudio 3 (coulis de frambuesa)
2.3.1. Las muestras
Cinco muestras de coulis de frambuesa se
prepararon a partir de bayas congeladas adquiridas
de un proveedor local (Gilmores Wholesale Food
and Beverage Supplies, Auckland, Nueva Zelanda).
Las bayas descongeladas fueron reducidas a pulpa
en una licuadora Cuisineart. Las muestras fueron
creadas mediante la manipulacin de la dulzura
(sacarosa aadida al 3% o 6%), sabor a bayas (1%
de sacarosa y 0,2% de esencia de moras de Blue
Pacific) o acidez (cidos mlico y tartrico aadidos
(Sigma Aldrich, Saint Louis, MO), 0,1% y 0,4%,
respectivamente). Tambin se incluy una muestra
no adulterada. Los coulis preparados se midieron
cantidades de 150 g, fueron congelados y
descongelados antes de la evaluacin.
2.3.2. Evaluaciones del panel entrenado
Un total de 10 panelistas entrenados (90% mujeres,
36-54 aos) particip. Eran miembros del panel

sensorial entrenado de Plant & Food Research y


haban pasado las pruebas de deteccin para
establecer su agudeza sensorial. Todos los
panelistas haban trabajado previamente en dos o
ms estudios de paneles entrenados utilizando
anlisis descriptivo genrico con bebidas frutales y/o
a base de frutas.
El anlisis descriptivo genrico (Lawless y Heymann,
2010) se utiliz para caracterizar las muestras de
coulis de frambuesa. El entrenamiento se llev a
cabo en cuatro sesiones de 2 h durante un perodo
de 2 semanas. Un experimentado lder del panel con
experiencia significativa en el anlisis sensorial de
frutas llev a cabo el entrenamiento. Se evaluaron
doce atributos de sabor y gusto seleccionados por el
panel, como se muestra en la Tabla 2. Se
desarrollaron los patrones de referencia y se emple
una escala lineal anclada a 0 = "ausente" y 150 =
"extremo".

una firma de reclutamiento profesional. Los


participantes dieron su consentimiento informado por
escrito y fueron compensados por su participacin.
Los datos de consumo se recogieron en un lugar
central de pruebas donde tambin se evaluaron
productos distintos del vino. La pregunta CATA
incluy 12 trminos (Tabla 2), se desarroll sobre la
base de la literatura existente (por ejemplo, Larsen,
Poll, Callesen, y Lewis, 1991; Villamor, Daniels,
Moore, y Ross, 2013) y la prueba piloto fue realizada
por profesionales sensoriales y personal de PFR que
se auto-identific como consumidores de
frambuesas. Los trminos se presentaron en orden
diferente para cada producto y cada participante de
acuerdo a las recomendaciones (Ares, Trrega,
Izquierdo, y Jaeger, 2014), siguiendo un diseo
equilibrado para el orden de presentacin (cuadrado
latino de Williams). No se obtuvieron respuestas
hednicas.

La recoleccin de datos se llev a cabo por triplicado


en dos sesiones. Todas las muestras (alcuotas de
12 g, preparadas 1,5 h antes de la evaluacin) se
presentaron a temperatura ambiente en recipientes
de plstico de 60 mL libres de olores marcados con
cdigos aleatorios de 3 dgitos. El orden de
presentacin fue mondico, de acuerdo con los
diseos que eran equilibrados para el orden de
presentacin y los efectos de arrastre (diseo de
Williams). Fueron necesarios recesos entre las
muestras (5-10 min) durante los cuales estuvieron
disponibles agua, solucin de pectina (0,1% w / v) y
galletas de agua para la limpieza del paladar. Los
panelistas fueron sentados en cabinas sensoriales
estndar (con luz verde y condiciones controladas
de flujo de aire y temperatura (21-23C)).

Todas las muestras (alcuotas de 12 g, preparadas


1,5 h antes de la evaluacin) se presentaron a
temperatura ambiente en recipientes de plstico de
60 mL libres de olores marcados con cdigos
aleatorios de 3 dgitos. El orden de presentacin fue
mondico, de acuerdo con los diseos que eran
equilibrados para el orden de presentacin y los
efectos de arrastre (diseo de Williams). Los recesos
entre las muestras fueron de 90 s y estuvieron
disponibles galletas de agua y agua para la limpieza
del paladar (opcional). Los panelistas fueron
colocados en cabinas sensoriales estndar (con luz
verde y condiciones controladas de flujo de aire y
temperatura (21-23 C)).

2.3.3. Evaluaciones de los consumidores

2.4.1. Las muestras

Un total de 102 consumidores tom parte (39%


mujeres, 22-60 aos). A todos les gustaban las
frambuesas y estaban dispuestos a consumir coulis
de frambuesa. El estudio se llev a cabo en
Auckland (Nueva Zelanda) con los participantes que
se registraron en una base de datos manejada por

Se utilizaron cinco diferentes tipos de vino blanco


Sauvignon (9% a 13% ABV), todos disponibles
comercialmente en New Zealand (NZ). Los vinos
eran de la cosecha del 2012 y representaban
diferentes regiones y productores de Sauvignon
blanc y productores (incluyendo las regiones de

2.4. Estudio 4 (vino blanco)

Nueva Zelanda Marlborough y Hawkes Bay y un vino


mezclado con uvas cultivadas en Nueva Zelanda y
Australia). Una muestra se present dos veces
(muestra replicada), lo que lleva a un total de seis
muestras.
2.4.2. Evaluaciones del panel entrenado
Un total de 10 panelistas entrenados, todas mujeres
(26-54 aos) particip. Eran miembros del panel
sensorial entrenado de Plant & Food Research y
haban pasado las pruebas de deteccin para
establecer su agudeza sensorial. Todos los
panelistas haban trabajado previamente en dos o
ms estudios sobre vino Sauvignon blanc.
Se realiz un anlisis descriptivo genrico (Lawless
y Heymann, 2010). El entrenamiento se llev a cabo
durante un total de 16,5 h durante un perodo de 3
semanas. Un experimentado lder del panel que era
experto en anlisis sensorial de vinos llev a cabo el
entrenamiento. Catorce atributos de gusto, sabor y
sensacin en la boca, para los cuales se han
desarrollado patrones de referencia, fueron
evaluados (Tabla 2). Se utiliz una escala lineal
anclada a 0 = ausente y 150 = extremo. El
protocolo sigui de cerca el trabajo previo de este
panel con vinos Sauvignon blanc (por ejemplo, Lund
et al., 2009; Makhotkina, Pineau, y Kilmartin, 2012).
La recoleccin de datos se llev a cabo por triplicado
en tres sesiones. Todas las muestras (alcuotas de
30 ml, preparadas 1 h antes de la evaluacin) fueron
presentadas a temperatura ambiente en vasos
estndar ISO XL5 de degustacin de vinos
marcados con cdigos aleatorios de 3 dgitos y
cubiertos con tapas de vidrio de reloj. Las muestras
se presentaron en una secuencia mondico,
siguiendo un diseo que fue equilibrado para el
orden de presentacin y los efectos de arrastre
(diseo de Williams). Se forzaron recesos (5-10 min)
entre las muestras durante los cuales los panelistas
se enjuagaban con agua y solucin de pectina (0,1%
w/v) y coman una galleta agua. Los panelistas
fueron colocados en cabinas sensoriales estndar

(con iluminacin blanca y condiciones controladas


de flujo de aire y temperatura (21-23C)).
2.4.3. Evaluaciones de consumidores
El estudio de consumidores se llev a cabo en
Auckland (Nueva Zelanda) con participantes que se
registraron en una base de datos manejada por una
firma de reclutamiento profesional. Un total de 134
personas particip (63% mujeres, 23-60 aos) y
todos eran bebedores regulares de vino Sauvignon
blanc (al menos una vez al mes). Otros detalles con
respecto al reclutamiento, la composicin de la
muestra, la tica y la compensacin eran idnticos a
Estudio 3 (vase ms arriba).
Los datos de los consumidores se recogieron en un
lugar central de pruebas donde tambin se
evaluaron productos distintos del vino. La pregunta
CATA incluy 15 trminos, se desarrollaron sobre la
base de la literatura existente (vase ms arriba) y la
prueba piloto fue realizada por profesionales
sensoriales y personal PFR que se auto-identific
como bebedores de vino Sauvignon blanc (Tabla 2).
Los trminos se presentan en orden diferente para
cada producto y cada participante de acuerdo a las
recomendaciones (Ares et al., 2014), siguiendo un
diseo equilibrado para el orden de presentacin
(cuadrado latino de Williams). No se obtuvieron
respuestas hednicas.
Todas las muestras (alcuotas de 15 ml, preparadas
1 h antes de la evaluacin) fueron presentadas en
copas de degustacin de vinos estndar ISO XL5
marcados con cdigos aleatorios de 3 dgitos y
cubiertos con tapas de vidrio de reloj. El orden de
presentacin fue mondico, de acuerdo con los
diseos que eran equilibrados para el orden de
presentacin y los efectos de arrastre (diseo de
Williams). Los recesos entre las muestras fueron de
90 s y estuvieron disponibles galletas de agua y
agua para la limpieza del paladar (no forzado). Los
panelistas fueron colocados en cabinas sensoriales
(luz blanca) a temperatura ambiente (18-23C).
2.5. Anlisis de los datos

Los procedimientos para el anlisis de datos en los


Estudios 1-4 fueron similares y se utilizaron los
protocolos establecidos para el anlisis de datos
descriptivos de panelistas entrenados y datos CATA.
Los detalles se dan a continuacin. Todos los
anlisis estadsticos se realizaron utilizando el
lenguaje R (R Core Team, 2013). Se utiliz el
software ExPosition (versin 2.8.19) para realizar el
anlisis de correspondencias (Beaton, Chin Fatt, y
Abdi, 2013), mientras que FactoMineR (versin 1.24)
se utiliz para llevar a cabo el Anlisis de
Componentes Principales y para calcular los
coeficientes de RV (L, Josse, y Husson , 2008).
2.5.1. Anlisis de datos de los panelistas entrenados
El rendimiento del panel se evalu mediante un
anlisis de varianza (ANOVA) en las calificaciones
de cada atributo. 'Muestra' se consider como una
fuente fija de variacin, mientras que 'sesin' y
'evaluador' fueron considerados como efectos
aleatorios. Las interacciones bidireccionales tambin
fueron consideradas en el modelo. El rendimiento
del panel entrenado se consider adecuado, ya que
las interacciones de evaluador-sesin, evaluadormuestra y muestra-sesin no fueron significativas.
Un nivel de significacin del 5% se consider en los
anlisis. Cuando los efectos eran significativos,
honestamente se calcularon las diferencias
significativas mediante la prueba de Tukey para un
nivel de confianza del 95%.
El Anlisis de Componentes Principales (PCA) se
realiz en la matriz de correlacin de las
puntuaciones de los atributos promediados para
todos los panelistas.
2.5.2. Anlisis de los datos CATA
La frecuencia de uso de cada trmino CATA se
determin contando el nmero de consumidores que
utilizan ese trmino para describir cada muestra. La
prueba Q de Cochran (Manoukian, 1986) se llev a
cabo para determinar las diferencias significativas
entre las muestras para cada uno de los trminos
sensoriales.

El anlisis de correspondencia (CA) se realiz en la


tabla de frecuencias de cada tratamiento
experimental considerando las distancias chicuadrado.
2.5.3. Estabilidad de las configuraciones de
muestras
La estabilidad de las configuraciones de muestras y
trminos obtenidos a partir de los consumidores se
evalu utilizando un enfoque autodocimante de remuestreo (Ares et al., 2014). El proceso de muestreo
autodocimante consisti en extraer subconjuntos
aleatorios de diferente tamao (m = 5, 10, 20, 30,...,
50,..., N) de los datos originales con N
consumidores, utilizando muestreo con reemplazo.
Para cada m, se obtuvieron 1000 subconjuntos
aleatorios. Para cada subconjunto, la tabla de
frecuencias correspondiente a los datos de los
panelistas seleccionados se calcul y se realiz el
anlisis de correspondencias (CA). La concordancia
entre las configuraciones de muestras y trminos en
las dos primeras dimensiones del CA y las
configuraciones de las referencias (obtenidas con
todos
los
consumidores)
fue
evaluada
independientemente para las muestras y los
trminos calculando el coeficiente RV entre sus
coordenadas (Abdi, 2010). Los valores promedio (y
las desviaciones estndar) para los 1000
subconjuntos aleatorios de tamao igual al nmero
total de consumidores en cada estudio (N) se
calcularon y se usaron como un ndice de la
estabilidad. Adems, se determin el nmero mnimo
de panelistas necesarios para lograr una RV Media
= 0,95 (Blancher, Clavier, Egoroff, Duineveld, y
Parcon, 2012), como punto de referencia para
evaluar la estabilidad de las configuraciones de
muestras y los trminos de CA.
Un procedimiento similar se utiliz para evaluar la
estabilidad de las configuraciones de muestras
obtenidas utilizando PCA en datos de panelistas
entrenados.
2.5.4. Comparacin de datos de los panelistas
entrenados y de los consumidores

La similitud entre los espacios sensoriales obtenidos


de panelistas entrenados y de consumidores se
evalu mediante el coeficiente de RV (Robert &
Escoufier, 1976) entre configuraciones de muestras
en las dos primeras dimensiones del PCA/CA. La
importancia del coeficiente RV se puso a evaluacin
mediante una prueba de permutacin (Josse,
Husson, y Pags, 2007).

3. Resultados
Para reducir al mnimo la repeticin, los resultados
se presentan por tipo de anlisis llevado a cabo para
comparar las respuestas de los panelistas
entrenados y los consumidores que utilizan
preguntas CATA. Est ms all del alcance del
estudio presentar resultados DA y CATA completos
de todos los estudios y los lectores interesados
pueden ponerse en contacto con los autores para
obtener ms detalles.
3.1. Comparacin de las configuraciones de
muestras
Las configuraciones de muestras producidas por
panelistas entrenados y consumidores se
compararon por primera vez en trminos del
porcentaje de varianza/inercia explicado por las dos
primeras dimensiones del PCA/CA, respectivamente
(Tabla 3, columnas I y III). En todos los estudios, un
promedio de 83,0% de la varianza total se explica
por PC1 y PC2 derivada de los datos de los
panelistas entrenados (78,1 a 93,6% para estudios
individuales). Para las dos primeras dimensiones del
CA realizado en los datos CATA obtenidos de los
consumidores este valor fue ligeramente superior 86,5% (77,3 93,8% para estudios individuales). La
tendencia para el porcentaje de varianza explicada
por las dos primeras dimensiones de CA a ser mayor
que el valor correspondiente del PCA se observ en
la mayor parte de los estudios en esta investigacin,
y en ninguno de los estudios el porcentaje de
varianza explicada en los datos del entrenamiento
de panelistas fue notablemente ms grande (> 5%)

que el establecido a partir de los datos de los


consumidores.
Sin embargo, hubo una tendencia del porcentaje de
varianza explicada por la primera dimensin del PCA
de los datos de los panelistas entrenados a ser ms
pequeo que el porcentaje de inercia explicada por
la primera dimensin del CA de los datos CATA del
consumidor (Tabla 3). La diferencia en el porcentaje
de informacin contenida en la primera dimensin
del PCA/CA vari de 3,5% a 16,7%. El Estudio 2d
fue la excepcin a esta tendencia, ya que el
porcentaje de varianza explicada por la primera
dimensin del PCA fue mayor que el porcentaje de
inercia explicada por primera dimensin del CA
(58,0% vs. 50,6%). Estos resultados sugieren que
las configuraciones de muestra obtenidas con los
consumidores que utilizan CATA tenda a ser ms
unidimensional que los obtenidos usando DA con
panelistas entrenados.
Las configuraciones de muestras tambin se
compararon mediante el clculo del coeficiente RV
basado en las dos primeras dimensiones. En todos
los estudios esta estadstica era significativa y
siempre super el 0.7, con la excepcin del Estudio
2d donde RV = 0,60. Cabe destacar que en el
Estudio 1, el coeficiente RV entre las
configuraciones de muestras de CA y DA disminuy
a medida que el tamao de las diferencias entre las
muestras disminuy (Tabla 3). Sin embargo, en el
Estudio 2 la influencia de la magnitud de las
diferencias entre las muestras en el coeficiente de
RV no estaba clara. Cabe destacar que el
coeficiente de RV en el Estudio 2d (medias
diferencias) fue menor que el del Estudio 2c
(pequeas diferencias)
A pesar de los relativamente altos valores del
coeficiente RV, las configuraciones de muestras de
las preguntas CATA y el DA no eran idnticas y se
identificaron algunas diferencias en las conclusiones
sobre las similitudes y diferencias en todos los
estudios. Para ejemplificar estas diferencias, la
Figura 1 muestra ejemplos de configuraciones de DA

con panelistas entrenados y preguntas CATA con


consumidores para los estudios con el ms alto y el
ms bajo coeficiente RV (estudios 3 y 2d,
respectivamente), as como de un estudio con un
valor intermedio del coeficiente RV (Estudio 4).
En el Estudio 3, las muestras de coulis de frambuesa
se separaron principalmente a lo largo de la primera
dimensin del CA, que corresponda a la dimensin
dulce/agrio (Fig. 1a). Los consumidores fueron
capaces de identificar y distinguir las muestras con
sacarosa aadida (muestras 2 y 3, creadas mediante
la adicin de 3% y 6% de sacarosa,
respectivamente) de la muestra no adulterada
(muestra 1). Adems, fueron capaces de detectar la
adicin de cido mlico y tartrico (muestra 4). Sin
embargo, los consumidores no parecen percibir la
adicin del saborizante de bayas, como la muestra 5
se encuentra muy cerca de la muestra 1. Si bien el
coeficiente RV entre las configuraciones de
muestras de las preguntas CATA y el DA fue de 0,99,
las conclusiones con respecto a las similitudes y
diferencias entre las muestras no eran idnticas (Fig.
1a). Como era de esperar, los panelistas entrenados
mostraron una mejor capacidad discriminativa que la
de los consumidores. Los panelistas entrenados
fueron capaces de percibir todos los cambios
inducidos en las caractersticas sensoriales de la
muestra 1. En particular, perciben las muestras 1 y 5
como diferentes en su dulzor y sabor afrutado (datos
no mostrados).
En el Estudio 2d (bebidas de naranja en polvo: RV
entre configuraciones de muestras = 0,60) se
identificaron varias diferencias en las conclusiones
con respecto a las similitudes y diferencias entre las
muestras entre el DA y las preguntas CATA. Como
se muestra en la Fig. 1b, los panelistas entrenados
perciben la muestra H marcadamente diferente del
resto de las bebidas en polvo debido a su sabor
dulce y a mandarina. Esta muestra tuvo una
intensidad media de 6,0 (de 10) de aroma de
mandarina, mientras que el resto de las muestras
tena puntuaciones medias cerca de 1,0 (de 10).
Mientras tanto, la muestra H no se orden lejos del

resto en las dos primeras dimensiones del CA de los


datos de las preguntas CATA, lo que podra
explicarse teniendo en cuenta que los consumidores
no asocian la muestra con aroma de mandarina (su
frecuencia de citacin fue del 27%, similar a
muestras I, D y E). Adems, la configuracin de la
muestra del DA segment las nueve muestras en
cuatro grupos marcados, mientras que las muestras
no fueron agrupadas claramente en la configuracin
de muestras obtenida a partir de los consumidores
que utilizaron preguntas CATA (Fig. 1b).
En el Estudio 4 (vino blanco), las configuraciones de
muestra obtenidos con panelistas entrenados y con
consumidores son muy similares, a excepcin de la
posicin de la muestra 3. Como se muestra en la
Fig. 1c, los panelistas entrenados percibieron la
muestra 3 marcadamente diferente del resto de las
muestras, mientras que los consumidores no
percibieron grandes diferencias entre las muestras 3
y 4. Adems, los consumidores y los panelistas
entrenados fueron capaces de identificar las
muestras idnticas, como lo demuestra la
localizacin de las muestras 1 y 10 en la primera y
segunda dimensin de la MFA.
3.2. Comparacin de la estabilidad de las
configuraciones de muestras
La estabilidad de configuraciones de muestras se
evalu utilizando un enfoque de remuestreo
autodocimante. Como se muestra en la Tabla 4, el
coeficiente medio de RV a travs de simulaciones
para el nmero total de consumidores fue igual o
superior a 0,95, lo que sugiere que las
configuraciones fueron estables y, por lo tanto, los
datos de los consumidores eran fiables. Estos
valores fueron iguales o mayores que el umbral
propuesto por Blancher et al. (2012): RV = 0,95. El
nmero mnimo de consumidores necesarios para
alcanzar este umbral vari desde 19 hasta 110.
Como era de esperar, en los Estudios 1 y 2 el
coeficiente medio de RV en las simulaciones tenda
a disminuir a medida que el grado de diferencia
entre las muestras disminua, mientras que el

nmero mnimo de los consumidores necesario para


lograr un RV = 0,95 tenda a aumentar. Por ejemplo,
en el Estudio 1b, que involucr a diferencias
medias entre las muestras, solo 19 consumidores
eran necesarios para alcanzar el umbral de
estabilidad, mientras que cuando se consideraban
diferencias pequeas entre las muestras (Estudio
1a), fueron necesarios 91 consumidores.
Con fines comparativos la estabilidad de las
configuraciones de muestras obtenidas utilizando
PCA de datos DA se evalu usando el mismo
procedimiento. Como se muestra en la Tabla 4, las
configuraciones de muestras para todos los estudios
mostraron coeficientes de RV ms altos que 0,95, lo
que sugiere una alta estabilidad de configuraciones
de muestras.
La estabilidad de las configuraciones de trminos fue
ms baja que la estabilidad de las configuraciones
de muestras, de acuerdo con los resultados
reportados por Ares et al. (2014). El coeficiente
medio de RV en las simulaciones para
configuraciones de trminos fue de 0,92 o superior
para todos los estudios y 0,95 o superior para tres
estudios (Tabla 4), dos de los cuales implicaban la
evaluacin de las muestras con diferencias medias
(Estudios 1b y 2b).
3.3. Comparacin de descripciones de muestras
En general, las descripciones de productos
obtenidas de consumidores que utilizan preguntas
CATA fueron similares a los proporcionados por
panelistas entrenados. La intensidad de atributos en
el DA se correlacion con el porcentaje de
consumidores que seleccion el atributo para la
descripcin de una muestra en la mayora de los
casos. Por ejemplo, en el Estudio 3 (coulis de
frambuesa) la muestra 4 se caracteriza por su acidez
acuerdo con los consumidores y los panelistas
entrenados (Fig. 1a), mientras que las muestras 2 y
3 se caracterizan por su dulzor. Sin embargo,
algunos consumidores parecen ser incapaces de
detectar atributos de sabor especficos y por lo tanto
la intensidad del atributo no se correlacion con el

porcentaje de consumidores que selecciona el


atributo para la descripcin de las muestras. Un
ejemplo de esto fue 'aroma de mandarina', como se
ha discutido anteriormente en relacin con el Estudio
2d (bebidas en polvo). Otro ejemplo es el 'sabor de
vainilla' (Estudio 1: postres de leche), el cual fue
usado por los panelistas entrenados para discriminar
entre muestras, pero los consumidores no lo
hicieron. Este trmino y 'no mucho sabor a vainilla'
se encuentran cerca del origen del espacio de CA, lo
cual indica falta de fuertes asociaciones con
cualquier muestra (datos no mostrados).
Ms en general, la correlacin entre la intensidad del
atributo en el DA y el porcentaje de los
consumidores que selecciona el atributo para la
descripcin de las muestras dependa tanto de la
naturaleza del atributo y el grado de diferencia entre
las muestras. Grficos demostrativos de la relacin
entre ambas medidas se muestran en la Fig. 2. De
particular relevancia para los objetivos de esta
investigacin, la correlacin entre la intensidad del
atributo y el porcentaje de los consumidores fue
mayor para los atributos simples (por ejemplo,
espeso o agrio) que para los atributos complejos
o atributos que carecan de una definicin nica (por
ejemplo gomosidad o sabor a naranja). Adems,
la correlacin entre las dos variables tendi a
aumentar con el tamao de las diferencias entre las
muestras; siendo mayor para los atributos
complejos.
3.4. Comparacin de diferencias significativas entre
las muestras
En cada estudio, el porcentaje de descriptores
sensoriales capaz de discriminar entre las muestras
se calcul y se muestra en la Tabla 3 (columna II y
IV, para los panelistas entrenados que realizaron
anlisis descriptivo y los consumidores que utilizaron
preguntas CATA, respectivamente). En todos los
estudios, un promedio de 92,4% de los descriptores
utilizados por los panelistas entrenados discrimin
significativamente entre las muestras (78-100% para
estudios individuales). El valor correspondiente fue

del 75,6% para los consumidores que utilizaron


preguntas CATA (42-100% para estudios
individuales). Mientras que los panelistas entrenados
identificaron diferencias entre las muestras en un
porcentaje mayor de atributos que los consumidores
en algunos estudios (por ejemplo, 1A y 4), los
valores porcentuales fueron algunas veces similares
(Estudio 2d), o incluso ligeramente superiores entre
los consumidores (Estudio 2a). Sin embargo, es
importante hacer hincapi en que no es posible
comparar la capacidad de discriminacin de los
panelistas entrenados y los consumidores mediante
la comparacin del porcentaje de trminos con
diferencias significativas, ya que los trminos
incluidos en el anlisis descriptivo y las preguntas
CATA no eran idnticos en algunos de los estudios.
La capacidad de discriminacin de las preguntas
CATA con los consumidores y la del DA con
panelistas entrenados se compar a los atributos
sensoriales que eran comunes entre las
metodologas. El porcentaje de descriptores
utilizados por los panelistas entrenados cuyas
conclusiones con respecto a las diferencias entre las
muestras fueron diferentes con respecto a los
consumidores que utilizaron preguntas CATA se
muestra en la Tabla 3 (columna V). Las diferencias
se identificaron para hasta tres descriptores (0-25%),
dependiendo del estudio, y en la gran mayora de
estos casos se identificaron diferencias significativas
para los panelistas entrenados y no para los
consumidores. Para los Estudios 1a/1b, se
encontraron diferencias en la capacidad para
identificar diferencias significativas entre las
muestras para un solo descriptor sabor a vainilla
y suavidad, respectivamente. Un nico descriptor
fue identificado en el Estudio 2a ('aroma de
mandarina'), mientras que tres descriptores fueron
identificados en el Estudio 2b ('aroma de
mandarina", "sabor artificial" y "retrogusto"). En los
estudios 2c y 2d, no hubo descriptores cuyas
conclusiones con respecto a las diferencias de
muestras difieran entre los dos paneles. Para las
muestras de coulis de frambuesa en el Estudio 3, los
dos descriptores, donde los dos paneles divergieron

en las diferencias de muestras identificadas fueron


'floral' y 'caracterstico de frambuesa'. Tres
descriptores - "verde", "espeso/viscoso" y
"persistente/hormigueante/punzante"
fueron
utilizados de manera diferente por los dos paneles
para describir las muestras de vino blanco (Estudio
4). En general, estos resultados sugieren que el DA
con panelistas entrenados mostr mayor capacidad
discriminativa de las caractersticas de sabor
especfico (por ejemplo, 'floral', 'vainilla',
'mandarina'), atributos de textura complejos (por
ejemplo, "suave"), atributos que podran ser difciles
de entender para los consumidores (por ejemplo,
'hormigueante' y 'viscoso' en vino) y los trminos que
podran no tener un significado nico para los
consumidores (por ejemplo, tpico Sauvignon
blanc).
4. Discusin
4.1. Qu tan similares son las configuraciones de
muestras inducidos y las descripciones de los
productos?
En el presente trabajo, los resultados del anlisis
descriptivo (DA) con panelistas entrenados y las
preguntas CATA con consumidores se compararon a
travs de una serie de estudios. Los coeficientes RV
entre las configuraciones de muestras fueron
siempre significativas y oscilaron entre 0,60 y 0,99.
Valores similares de RV han sido considerados
anteriormente como indicadores de una buena
concordancia entre configuraciones de muestras
(Abdi, Valentin, Chollet, y Chrea, 2007; Kennedy,
2010; Lawless y Glatter, 1990; Lelivre, Chollet,
Abdi, y Valentin, 2008). Sin embargo, la
concordancia entre las configuraciones de muestras
del DA y las preguntas CATA fue menor que los
reportados por otros autores (Ares et al, 2010;
Bruzzone et al, 2012; Cadena et al, 2014; Dooley et
al, 2010), que probablemente se puede atribuir al
hecho de que el presente trabajo trat con pequeas
diferencias entre las muestras y/o productos ms
complejos (por ejemplo, vino).

Las configuraciones de muestras y trminos


obtenidos utilizando el anlisis de correspondencia
en los datos de las preguntas CATA tienden a ser
estables (coeficientes RV promedio de las
simulaciones mayores a 0,90), lo que indica que los
consumidores produjeron resultados confiables. El
nmero mnimo de consumidores necesario para
alcanzar el umbral de estabilidad propuesto por
Blancher et al. (2012) (RV = 0,95) tendi a ser mayor
que los valores reportados por Ares, Trrega, et al.
(2014). Probablemente, esto se debi a las
diferencias entre las muestras en la presente
investigacin que fueron ''medias'' o ''pequeas'', lo
que indica que el tamao de muestra de
consumidores necesita ser aumentado a medida que
se reducen las diferencias entre las muestras. La
influencia del tamao de las diferencias entre las
muestras se puede observar claramente
comparando el nmero mnimo de consumidores
necesarios para obtener configuraciones de
muestras estables en los Estudios 1a y 1b y los
Estudios 2a y 2b. Aunque las preguntas CATA no
permiten una cuantificacin directa de la intensidad
del atributo, en la mayora de los casos en los que
los consumidores y los panelistas entrenados
evaluaron los mismos atributos sensoriales, el
porcentaje de consumidores que selecciona un
trmino para describir las muestras se correlacion
con la intensidad de atributos, tal como se cuantifica
por un panel evaluador entrenado utilizando escalas
no estructuradas (Fig. 2). Teniendo en cuenta los
trminos utilizados por ambos tipos de paneles, se
encontr que a medida que la intensidad de un
atributo aumenta, tambin aumenta la probabilidad
de que los consumidores seleccionen el trmino de
la pregunta CATA. Este resultado proporciona
evidencia adicional para apoyar el uso de preguntas
CATA para cuantificar indirectamente la intensidad
de atributos sensoriales percibida por los
consumidores, sobre todo cuando se trata de
atributos sensoriales simples y/o conjuntos de
muestras donde las diferencias son medias (o
mayores). Esto coincide con el hecho de que se ha
reportado que los consumidores inexpertos han sido

capaces de cuantificar la intensidad de un atributo


sensorial simple (Ares et al, 2011; Hayes, Sullivan, y
Duffy, 2010; Husson, Le Dien, y Pags, 2001; Li,
Hayes, & Ziegler, 2014).
La correlacin entre el porcentaje de consumidores
que seleccionan un trmino CATA para describir
muestras e intensidad de atributos fue menor para
caractersticas sensoriales complejas que para
caractersticas sensoriales simples (Fig. 2). Del
mismo modo, cuando se utilizan preguntas CATA en
diferentes sesiones se ha reportado que los
consumidores muestran menor repetibilidad en la
evaluacin de atributos relacionados con
caractersticas sensoriales complejas que carecen
de una definicin nica, como mal sabor, artificial y
retrogusto (Ares et al, 2014; Jaeger et al., 2013).
Estos resultados sugieren que sera recomendable
que los trminos incluidos en las preguntas CATA
sean fciles de entender y comprendidos de manera
similar por todos los consumidores.
Adems, la correlacin entre la frecuencia de
citacin de trminos CATA y la intensidad del atributo
disminuy a medida que el tamao de la diferencia
entre las muestras se redujo (Fig. 2). Esto sugiere
que las preguntas CATA con consumidores podra
no ser una alternativa metodolgica opcional si el
objetivo del estudio es detectar pequeas o sutiles
diferencias entre las muestras.
Se identificaron varias diferencias entre las
configuraciones de muestras del DA y las preguntas
CATA, en particular respecto a las conclusiones
sobre las similitudes y las diferencias entre las
muestras (comprese con la Fig. 1). En muchos
casos, los panelistas entrenados mostraron mayor
capacidad discriminativa ya que fueron capaces de
identificar las diferencias entre las muestras que los
consumidores no perciben. Adems, la capacidad de
discriminacin de las preguntas CATA con
consumidores fue menor que la del DA con
panelistas entrenados para los atributos sensoriales
que estaban relacionados con atributos sensoriales
complejos (por ejemplo, suavidad en postres de

leche, o de viscosidad en el vino) o atributos de


sabor especficos (por ejemplo, aroma de mandarina
en con sabor a naranja bebidas en polvo).
Las diferencias en la capacidad discriminativa del DA
y las preguntas CATA probablemente puede
explicarse teniendo en cuenta que DA utiliza un
vocabulario comn y estandarizado y el
entrenamiento aumenta la capacidad de los
panelistas para detectar pequeas diferencias entre
las muestras (Labbe, Rytz, y Hugi, 2004; Lawless y
Heymann, 2010). Varios autores han informado que
los panelistas entrenados son capaces de detectar
pequeas diferencias entre productos, a diferencia
de los panelistas no entrenados (Cardello et al,
1982; Guerrero, Gou, y Arnau, 1996; Roberts y
Vickers, 1994; Sawyer, Cardello, y Prell, 1988;
Wolters y Allchurch, 1994). Adems, el hecho de que
el DA se basa en la evaluacin de atributos
especficos utilizando escalas de intensidad y el uso
de evaluaciones replicadas podra haber contribuido
a una mayor capacidad de discriminacin con
respecto a las preguntas CATA. Las diferencias en el
poder estadstico de las tcnicas utilizadas para el
anlisis del DA y las preguntas CATA (tcnicas
paramtricas vs. tcnicas no paramtricas,
respectivamente)
tambin
pueden
haber
desempeado un rol.
Las configuraciones de muestras que se obtuvieron
utilizando preguntas CATA con los consumidores
tienden a ser ms unidimensionales que las del
anlisis descriptivo con panelistas entrenados (Tabla
3i y iii), lo que podra atribuirse al hecho de que los
consumidores centraron su atencin en las
principales diferencias entre muestras y que no se
identificaron diferencias ms sutiles. Este resultado
puede explicarse por las diferencias en la agudeza
sensorial de los consumidores y de los panelistas
entrenados, as como el hecho de que las preguntas
CATA no motivan a los consumidores a evaluar los
atributos especficos.
Los resultados de este trabajo muestran que la
caracterizacin sensorial utilizando preguntas CATA

con consumidores tiene algunas limitaciones cuando


se trabaja con conjuntos de muestras con
diferencias pequeas entre muestras y/o cuando
se evalan caractersticas sensoriales/de productos
complejas. En estas situaciones las preguntas CATA
utilizadas por los consumidores no entrenados
pueden no proporcionar informacin equivalente a la
del DA con panelistas entrenados. Por lo tanto,
cuando se trata de conjuntos de muestras con
sutiles diferencias entre muestras, podra no ser
recomendable emplear consumidores que utilizan
preguntas CATA.
Sin embargo, esta conclusin ignora la posibilidad
de que las diferencias entre las caracterizaciones
sensoriales de productos puedan estar relacionadas
con diferencias en la agudeza sensorial de los
consumidores y de los panelistas entrenados debido
al entrenamiento. Tambin falla en reconocer que la
caracterizacin sensorial con consumidores puede
abordar diferencias individuales en la percepcin y
contribuir a una mejor comprensin de la
segmentacin hednica (Hayes, 2015; Moskowitz &
Bernstein, 2000). En este sentido, investigaciones
anteriores han resaltado que los consumidores con
diferentes patrones de preferencia describen
muestras de manera diferente por medio de
preguntas CATA, en particular para los trminos
relacionados con caractersticas sensoriales
complejas o intensidad de atributos (Ares y Jaeger,
2015).
En el presente trabajo se utilizaron preguntas
hednicas simultneamente con preguntas CATA en
los estudios 1 y 2, mientras que los datos hednicos
no fueron recogidos en los estudios 3 y 4. Teniendo
en cuenta que investigaciones anteriores (Ares y
Jaeger, 2015) han demostrado que las preguntas
hednicas no influencian en las respuestas a las
preguntas CATA, la similitud entre los espacios
sensoriales obtenidos por medio de preguntas CATA
y anlisis descriptivo no se espera que sea
influenciado por la generacin concurrente de datos
sensoriales y hednicos.

4.2. Sugerencias para futuras investigaciones

5. Conclusiones

Es de destacar que no hay publicaciones sobre la


comparacin
de
perfiles
sensoriales
de
consumidores/CATA con los generados por paneles
que usen protocolos altamente especficos de
entrenamiento y evaluacin (por ejemplo,
Spectrum, QDA). Tentativamente, tales paneles
altamente entrenados, con frecuencia comprenden
panelistas experimentados con aos de experiencia
en la evaluacin de un conjunto limitado de
categoras de productos, pueden proporcionar
descripciones ms matizadas que las de
consumidores que son usuarios regulares de
productos.

Si las caracterizaciones sensoriales de productos


obtenidas con panelistas entrenados y consumidores
en esta investigacin se comparan a travs de una
lente que tiene por objeto determinar si los
consumidores que utilizan preguntas CATA generan
el mismo grado de detalle en las descripciones de
muestras y en la identificacin de las diferencias de
muestras como lo hacen los panelistas entrenados,
la respuesta es no. Aunque las configuraciones y
descripciones de muestras generadas son ms
similares que diferentes, cuando los productos son
complejos y/o similares se obtiene una mayor
precisin con panelistas entrenados. Este no es un
descubrimiento inesperado. Tal vez lo que es
inesperado es lo bien que los consumidores no
entrenados se desempearon en relacin a los
panelistas que fueron seleccionados sobre la base
de su agudeza sensorial y su entrenamiento para
escalar con precisin y fiabilidad la intensidad de
atributos para un gran nmero de caractersticas del
producto. La capacidad de los consumidores para
realizar tareas de caracterizacin sensorial se ha
demostrado anteriormente, pero esta investigacin
extiende estos resultados para muestras que son
similares y/o complejas (por juicio de los autores,
quienes son experimentados en la evaluacin
sensorial de las categoras focales de los productos).

Tambin observamos que an no han sido


publicadas comparaciones sistemticas de
caracterizaciones sensoriales de productos por
panelistas entrenados con las de los consumidores
que utilizan variantes de preguntas CATA como
preguntas forzadas de S-No (CATA de S-No) o
RATA (califique todo lo que corresponda). Se debe
ejercer precaucin en la generalizacin de
resultados de trabajos con el formato estndar CATA
a estas variantes. A pesar de que se puede esperar
que los resultados sean muy similares, tambin es
probable que algunas diferencias surjan. Por
ejemplo, puede haber ms ruido en datos RATA
generados con consumidores para muestras
complejas y similares tales como el vino
Marlborough Sauvignon blanc de Nueva Zelanda,
que en datos RATA de leche, chocolate negro y
blanco con diferentes sabores. Los datos RATA
generados por consumidores pueden mostrar falta
de consenso en las puntuaciones de intensidad en
un mayor grado que cuando el formato RATA se
utiliza con tipos diferentes de chocolate. Esto
probablemente tendr un impacto en la evaluacin
de la similitud con los datos de panelistas
entrenados, por ejemplo, con respecto a las
configuraciones de muestras y trminos.

Cules son las implicaciones de estos resultados


para los investigadores sensoriales y de
consumidores? Los resultados proporcionan un
nuevo impulso o la difuminacin en curso entre la
investigacin de paneles entrenados y la
investigacin de consumidores focalizada en el tema
sensorial. Las caracterizaciones sensoriales de
productos obtenidos con panelistas entrenados
probablemente conservarn su estatus de estndar
de oro. Sin embargo, los profesionales ahora son
capaces de tomar decisiones informadas acerca de
si se requiere el nivel de precisin que ofrece
anlisis descriptivo genrico en una situacin
especfica, o si la informacin generada por los
consumidores que utilizan preguntas CATA es apto

para el propsito en trminos de capacidad de


identificar similitudes/diferencias en muestras y la
especificidad de descripciones de muestras. La
capacidad de co-generar respuestas hednicas de
los consumidores es uno de los factores que debe
ser intercambiado con la (ligera) menor calidad de
los datos sensoriales.
Nuestra recomendacin basada en la investigacin
actual y el conjunto existente de literatura
relacionada es decidir, sobre una base de caso por
caso, cul es el enfoque de caracterizacin sensorial
de productos que se alinea mejor con los objetivos
focales de investigacin. Es poco probable que los
consumidores no entrenados que usan preguntas
CATA puedan proporcionar la precisin necesaria en
todos los casos. Estamos de acuerdo con Varela y
Ares (2012), que hacen hincapi en que los mtodos
rpidos (incluyendo preguntas CATA) no pueden ser
considerados como un reemplazo del anlisis
descriptivo genrico con panelistas entrenados.

6. Contribuciones de los autores


G.A., F.B. Y S.R.J. concibieron y planificaron el
estudio. G.A. y S.R.J. escribi el artculo. G.A., F.B.,
L.A. y L.V. analizaron los datos. Todos los dems
autores contribuyeron a la recopilacin de datos.

Agradecimientos
Se agradece al personal de Plant & Food Research
por la ayuda en la recoleccin de datos. El apoyo
financiero para los estudios realizados en Uruguay
fue otorgado por CAPES-Brasil y la Comisin
Sectorial de Investigacin Cientfica (Universidad de
la Repblica, Uruguay). Para los estudios realizados
en Nueva Zelandia, se recibi apoyo financiero del
Ministerio de Negocios, Innovacin y Empleo de
Nueva Zelanda y el Instituto de Investigacin de
Plantas y Alimentos de Nueva Zelanda Ltd.

You might also like