You are on page 1of 30

Una breve revisin de tcnicas de anlisis

multivariantes aplicables en Fitosociologa


ADRIN ESCUDERO*, ROSARIO GAVILAN*
& AGUSTN RUBIO**

Departamento de Hiologa Vegetal II. Facultad de Farmacia


Universidad Complutense de Madrid. E-28040
** Departamento de Silvopascicullura. ETSI Montes
Universidad Politcnica de Madrid. E-28040

Resumen:
EScLJDERO. A.; GAVILN, R. & RUBIO, A. 1994. Una breve revisin de tcnicas multivariantes aplicables en Fitosociologa. Botan/ca Comp!utensis, 19: 9-38.

Se presenta una breve semblanza de las tcnicas multivariantes que se estn utilizando actualrncnte en los estudias de vegetacin, intentando enfocaras a la resolucin de problemas titosociolgicos. Las tcnicas se han agrupado en dos grandes bloques, tas denominadas tcnicas
de gradiente y las de clasificacin numrica. Previo al estudio de dichas tcnicas se comentan
algunos conceptos generales como son la transformacin y la eslandarizacin de los datos, as
como la medida de la semejanza. Las tcnicas de gradienl.e han sido desglosadas para su estudio en tcnicas de regresin, de calibracin, de ordenacin y de ordenacin constreida. Las de
clasificacin numrica se han dividido en mtodos jerrquicos y divisivos. Finalmente, se traan los procedimientos numricos ms avanzados, como son tas tcnicas de comparacin de
particiones o las degeneracin de clasificaciones consensuadas. entre otras.
Palabras clave: Anlisis Multivariantes. Clasificacin, Fitosociologa, Ordenacin.
Abstract:
ESUUOERO, A.: GAVILN, R. & RUBIO, A. 1994. A brief review ef multivariate methods
with Phytosociological applicability. Botan/ca Complutensis, 19: 9-38.
A bricf review of multivariate methods used in Phytosociological studies is presented.
Thcse methods have been grouped in twa items: gradient techniques ard numerica classifieaions. Some general concepts like transtormation and standarization of data and similarity measures have been previously conmented. Gradient methods have been classified in regression,
calibration, ordination and constrained ordination techniques and, in Ihe other hand, we have
considered hierarchical and divisive methods under classification procedures. Finally, advanced numerical approaches, like partitions comparisons or consensus classifications, are treated.
Keywords: Multivariate Analysis, Classification, Phytosociology. Ordination.

Botan/ca Cornphacnsis 19: 9-38, Edil. Universidad Complulensc 1994

lo

Adrin Escudero, Rosario Gaviln & Agustn Rubio

INTRODUCCIN

Aunque el valor de la Fitosociologa como ciencia capaz de describir La


vegetacin es incuestionable (BRAUN-BLANQUET, 1964; MUCINA & AL.,
1993; WESTI-IOFF & VAN DER MAAREL, 1978), tambin se ha puesto de manifiesto la necesidad de resolver diversas lagunas y problemas de tipo metodolgico (VAN DER MAAREL, 1975; GOODALL, 1978; FISCiIER & BEMMERLEN-LUX, 989; LEPS & HANDICOVA, 1992). El desarrollo, a partir de los
aos sesenta, de mtodos numricos tiles para el estudio de la vegetacin ha
revolucionado, por lo menos en el contexto europeo, los estudios de vegetacin (KENT & BALLARO, 1988) y, por extensin, los fitosociolgicos (MUCINA & VAN DER MAAREL, 1989).
La Sintaxonoma Numrica, como ciencia auxiliar de la Fitosociologa,
fue definida por VAN DER MAAREL (1981) como consecuencia del desarrollo
de la Fitosociologa Numrica (LAMBERT & DALE, 1964; VAN DER MAAREL, 1969; DALE & WEBB, 1975), ya que permita resolver algunos de los
problemas de la Fitosociologa clsica, como son: la objetivacin del proceso
de obtencin de la jerarqua de tipos, la objetivacin de las Similitudes absolutas o relativas entre los inventarios, el clculo de la homogeneidad a cada
nivel jerrquico o la posibilidad de relacionar Los niveles sintaxonmicos con
los obtenidos en las clasificaciones y la infonnacin sintaxonmica con la jerrquica de una forma objetiva (F OL] & LAUSI, 1981).
Pese al fuerte desarrollo de la Fitosociologa espaola (PEINADO &
RIVAS-MARTNEZ, 1987), las aproximaciones numricas realizadas hasta
ahora no han sido demasiado numerosas (TARAZONA, 1984; BUENO &
FERNNDEZ-PRIETO, 1991; MORENO & AL., 990; TARAZONA & AL, 1991;
ESCUDERO & PAJARN, 1994). En este trabajo pretendemos dar una visin

panormica de las tcnicas numricas ms ampliamente utilizadas en estudios


fitosociolgicos, intentando sintetizar las revisiones aparecidas en los ltimos
aos sobre distintos aspectos y aproximaciones (ORLCI, 1978; CAUCE,
1982; PIELOU, 1984; DIGBY & KEMPTON, 1986; WILDI & ORLCI 1990;
LEGENDRE & LEGENDRE 1983). En el mbito espaol tambin destacan los
trabajos pioneros desarrollados por DAZ PINEDA & GONZLEZ
BERNLDEZ (1978) y MAZ PINEDA & AL. (1979) sobre la descripcin automtica de la vegetacin.

Estas tcnicas las hemos agrupado en dos bloques independientes, por un


lado los anlisis de gradiente, que se encargaran de describir las relaciones
entre los datos de vegetacin con los datos ambientales, y por otro, las clasificaciones numricas, que permitiran estructurar esos datos, agrupndolos,
de forma que los grupos resultantes sean lo ms homogneos posible, y que
estudiaremos en primer lugar.

Una breve revisin de tcnicas de anlisis multivariantes aplicables en Fitosociologa

11

Primero revisaremos algunos conceptos previos relacionados con la


transformacin de los datos, de importancia capital tanto en el contexto de
las clasificaciones como en el del anlisis de gradiente. Posteriormente estudiaremos la medida de la semejanza y a continuacin ambos bloques de tcficas, en primer lugar las tcnicas de gradiente y en segundo lugar las ordenaciones.
TRANSFORMACIN Y ESTANDARIZACIN DE DATOS
Las matrices de datos ecolgicos frecuentemente deben ser manipuladas
en diferentes sentidos con el fin de neutralizar algn fenmeno que no es de

inters (NOY-MEIR, 1973). En algn caso, estas transformaciones pueden ir


implcitas en un anlisis en concreto, caso de las ordenaciones relacionadas
con el CA (weighted averaging media ponderada), aunque generalmente
es una decisin del investigador. De forma sinttica, dichas manipulaciones

se pueden agrupar en:


*

Son alteraciones de los datos individuales en el conjunto de los mismos. Se reemplazan tos datos brutos por otros, aplicanTransftrmaciones.

do a todos la misma funcin algebraica. Entre las funciones ms utili-

zadas, podemos resaltar la raz cuadrada, las funciones logartmicas o


las funciones exponenciales. Los efectos tanto de la transformacin logartmica como de la raz cuadrada se relacionan con la atenuacin de
la influencia de las especies dominantes, mientras que la funcin exponencial enfatiza dicha influencia (VAN TONGEREN, 1987).
La escala de abundancia-dominancia utilizada en el mtodo fitosociolgico hace necesaria la transformacin de los datos a una escala de tipo ordinal
para poder aplicar sobre ellos cualquier tipo de anlisis numrico. Existen diversos mtodos de transformacin de dicha escala (SCHwtCKERATH, 1931,
1938, 1940; TXEN & ELLEMBERG, 1937), de los cuales algunos son de tipo
cualitativo, basados nicamente en datos de presencia/ausencia (WILLIAMS
& LAMBERT, 1959; VAN DER MAAREL, 1966), o seudocualitativos, en los
que los valo~ts de cobertura ms bajos se toman como ausencias (DAGNELIE,
1960). Estudios clsicos comparativos de unos y otros se pueden encontrar en
JENSEN (1978), CAMPBELL (1978) o VAN DER MAAREL (1979). WEsTI-OEF
& VAN DER MAAREL (1978) proponen una de las transformaciones ms utilizadas hoy en da, la cual consiste en una escala numrica del 1 al 9, en la que
el valor 2 de la escala fitosociolgica se divide en tres partes (atendiendo a
los porcentajes de la cobertura), de acuerdo con los criterios de BARKMANN
& AL. (1964).
* Estandarizaciones. Son alteraciones que se realizan de forma independiente a cada uno de los vectores (inventarios o especies) que compo-

12

Adrin Escudero, Rosario Gaviln & Agustn Rubio

nen la matriz de datos, brutos o previamente transformados. Hemos incluido bajo este epgrafe el centrado y la normalizacin como casos
particulares de la estandarizacin (CLFFORD & STEPHENSON, 1975).
El centrado de los datos consiste en restar a cada uno de los elementos

que forman un vector determinado el valor medio de dicho vector,


mientras que en la normalizacin se divide cada uno de los elementos
del vector por la longitud de ste (LECENDRE & LEGENDRE, 1983).
Uno de los mtodos ms comunes es el denominado estandarizacin por
totales (standardization by totais), que consiste en determinar la proporcin
que existe entre un elemento determinado del vector y el total del vector en
cuestin, expresando los datos como proporciones. Se puede realizar en los

dos sentidos de la matriz, bien por objetos (inventarios), bien por descriptores
(especies). En el primer sentido, hay que tener cuidado con las modificaciones inducidas tanto por la medida de semejanza, que puede ser sensible a aspectos cualitativos de los datos, como a las generadas por los tamaos de los
inventarios, sobre todo si stos son muy diferentes. En cuanto a la estandarizacin por totales de las especies, se sobrepesan las raras y se infravaloran las
comunes, por lo que slo se recomienda utilizarla si las frecuencias de las especies en la tabla no varan excesivamente (VAN TONGEREN, 1987).
Otro mtodo muy utilizado es la estandarizacin por el mximo valor, es
decir, dividiendo cada una de las abundancias por la mxima. Esta estandarizacin realizada en un doble sentido por inventarios y especies fue muy
utilizada por BRAY & CURTS (1957).
Finalmente, la aplicacin de algunos ndices de semejanza suponen la es-

tandarizacin implcita de los datos como es el caso de la distancia de la cuerda (chord distance) (ORLCI, 1967, 1978).
LA MEDIDA DE LA SEMEJANZA
Es la etapa base del tratamiento numrico de los datos, ya que examnan-

do la matriz de semejanza se puede elucidar la estructura de los datos e incluso responder a alguna de las cuestiones propuestas. Es, por ello, la primera

etapa a realizar en anlisis numricos, o quiz la nica (LECENDRE & LECENDRE, 1983). Se efecta midiendo la similitud entre los objetos, o bien
entre las variables que los describen. Existe una gran variedad de ndices de
semejanza, aunque muchos de ellos son meras variantes de otros y tienen sus

mismas propiedades (ORLCI, 1978).


Una matriz de datos puede estudiarse desde dos puntos de vista
(CATTELL, 1952), bien observando las relaciones entre los objetos (inventanos), o bien entre los descriptores (especies). Si adems incluimos el tiempo
como una tercera dimensin a estudiar, se pueden definir seis tipos de anlisis

Una breve revisin de tcnicas de anlisis multivariantes aplicables en Fitosociologa

13

(CATTELL, 1966), de los cuales en este apaado slo se van a tratar las ya
mencionadas, es decir: 1) la semejanza entre objetos y 2) entre descriptores.
El primero incluye los coeficientes de semejanza y los coeficientes de distancia; el segundo, los coeficientes de dependencia.
a) Coeficientes de semejanza
Se utilizan para medir la asociacin entre los objetos. Estas medidas no
son nunca mtricas en oposicin a las medidas de distancia y, por tanto, las
semejanzas no pueden ser utilizadas para posicionar los objetos unos frente a
otros en un espacio mtrico. Generalmente se utilizan como base de los anlisis de agrupamiento, aunque stos admiten indiferentemente un tipo u otro de
medidas (LEGENDRE & LEGENDRE, 1983).

Fueron desarrollados para datos binarios de tipo presencia/ausencia. En


este tipo de datos, uno de los principales factores a tener en cuenta es la presencia de los dobles ceros. Esta situacin es muy frecuente en ecologa, ya
que muestras realizadas sobre un nmero de especies determinadas pueden
damos una matriz de datos con muchos dobles ceros, sobre todo en aquellas
muestras ms pobres. En estas ltimas, y dependiendo del coeficiente utilizado, podemos obtener semejanzas muy altas, aunque las muestras originales
sean muy diferentes entre s en lo que a descriptores se refiere. Por ello, estos
coeficientes de semejanza se dividen enre aquellos que excluyen de su clculo los dobles ceros y los que no.
*

Coeficientes binarios que incluyen los dobles ceros. La semejanza se


basa en la presencia/ausencia de determinadas caractersticas en las dos
muestras. Algunos de ellos no tienen en cuenta la diferencia entre el
doble cero y el doble uno, como el de SOKAL & MICI-IENER (1958).
Otros le dan un peso mayor a las semejanzas que a las diferencias
(SOKAL & SNEATH, 963), o viceversa (ROGERS & TANIMOTO,
1960).

Coeficientes binarios que no incluyen los dobles ceros. Entre ellos tenemos los que dan igual peso a los descriptores considerados (JACCARD, 1908) o los que dan un peso doble o triple a la doble presencia
(SORENSEN, 1948). Por el contrario, existen otros que dan mayor peso
a las diferencias (SOKAL & SNEATH, 1963). Algunos son similares a
los coeficientes que incluan los dobles ceros, pero excluyendo Ja parte
correspondiente a stos (OCl-ilAt, 1957). En estos ltimos, las menores
semejanzas dan valores a los ndices positivos o negativos pero cercanos a cero, mientras que semejanzas muy grandes dan valores cercanos
a la unidad, pudiendo llegar a infinito (CLIFFORD & STEPHENSON,
1975).

Adrin Escudero, Rosario Gaviln & Agustn Rubio

Posteriormente se desarrollaron coeficientes para datos cuantitativos e incluso para datos mixtos. De todos ellos podemos destacar:
* coeficientes cuantitativos que incluyen los dobles ceros. Todos los

coeficientes binarios se pueden extrapolar aqu. De entre todos ellos


podemos citar el ndice de GOWER (1971), muy laborioso de calcular,
en el que no se realiza la comparacin entre dos objetos cuando falta
uno de ellos, y s se realizar en el caso en que ambos estn presentes o
ausentes. De anlogas caractersticas es el de ESTABROOK & ROGERS
(1966), aunque la medida de la similitud es diferente.
Coeficientes cuantitativos que excluyen los dobles ceros. Tambin se
pueden incluir aqu los coeficientes binarios. De entre stos podemos
comentar el indice de JACCARD (1908) modificado, el cual se suele
utilizar, sobre todo, cuando la abundancia de las especies est codificada bajo un pequeo nmero de clases y se quieren estudiar las diferencias entre ellas. En el resto de estos casos su empleo conleva una prdida parcial de la informacin contenida en los descriptores de abundancia.

Las medidas de semejanza tpicamente cuantitativas se pueden dividir en

dos grupos, segn que usen datos brutos o datos normalizados o estandarizados. Entre las primeras, las hay que comparan la ms pequea de las abundancias respecto a la media de las dos muestras tomadas en consideracin
(CZEKANOWSKI, 1909, 1913); y entre las segundas tenemos variaciones de
algunos ndices binarios y cuantitativos que excluyen los dobles ceros,
b) Coeficientes de distancia
Comprenden una serie de ndices que tienen en comn dar un valor mximo a dos objetos completamente distintos y un valor mnimo a dos objetos
idnticos, respecto a los descriptores utilizados en el anlisis. Las medidas de
distancia se dividen en dos grupos: las mtricas, que obedecen a una serie de
propiedades (ver LEGENDRE & LEGENDRE, 1983) y las semimtricas, denominadas por algunos autores como de disimilitud, en contraposicin a las m-

tricas, que son consideradas como las nicas medidas reales de distancia en
sentido estricto. La distancia y la semejanza estn ntimamente relacionadas a
travs de un conjunto de frmulas matemticas, siendo D=l-S (D: distancia;

5: semejanza) la ms sencilla de entre todas las existentes.


Entre los coeficientes ms utilizados destaca la Distancia Fucile/ea, basada en el teorema de Pitgoras, que define la relacin existente entre dos puntos que se encuentran en un espacio eucldeo de n dimensiones. El problema
de esta medida es que no tiene lmite superior y aumenta a medida que se incrementa el nmero de descriptores. Tambin depende de la escala de stos,

Una breve revisin de tcnicas de anlisis muir/variantes aplicables en Fitosociologa

15

ya que al cambiar la escala (por ejemplo, con transformaciones), las distan-

cias se modifican. Este problema se resuelve empleando variables centradas o


matrices de datos dimensionairnente homogneas.
Tambin puede ocurrir que dos muestras sin ninguna especie en comn
puedan tener una medida de distancia eucldea ms pequea que otro par de
muestras con las mismas especies, debido a la presencia de muchos dobles
ceros. Este problema se puede resolver transformando o normalizando los
datos originales. Para evitar los inconvenientes de la Distancia Eucldea se
han propuesto algunas modificaciones, como es la distancia de la cuerda
(Chord Distance), propuesta por ORLCI (1967, 1978), en la que los vectores soi ionnalizados y los dobles ceros excluidos.
e) Coeficientes de dependencia

El ms utilizado es la correlacin de Pearson, tambin denominado correacin producto-momento (r), definida como la covarianza calculada sobre
los datos centrados y reducidos (LEGENDRE & LEGENDRE, 1983). 1-la sido
utilizado como medida de semejanza en taxonoma para aquellas situaciones
en las cuales los caracteres cualitativos de una muestra (animales o plantas)
son ms importantes que los cuantitativos (SOKAL & MICHENER, 1958). El
uso de este indice debe ser restringido sobre todo cuando se estudian matrices
de datos donde existe un 50% de ceros o ms, es decir, con muchas especies
raras o poco abundantes que originan unos valores de r muy pequeos, aunque las especies dominantes en las muestras sean las mismas (CLIFFORD &
STEPHENSON, 1975).

ANLISIS DE GRADIENTE
1. Planteamiento
El valor de estas tcnicas desde el punto de vista fitosociolgico estriba
fundamentalmente en la posibilidad de caracterizar ecolgicamente tanto las

plantas como [as unidades de vegetacin, aunque, como veremos, tambin


pueden ser valiosas herramientas de clasificacin.
Segn TER BRAAK & PRENTICE (1988), recogido tambin por OKLAND
(1990) y JONGMAN & AL. (1987), la expresin ANLISIS DE GRADIENTE
hace referencia a tcnicas que permiten la interpretacin de las comunidades
en trminos de la respuesta de las especies a los gradientes ambientales, entendiendo esta respuesta en un sentido muy amplio. Estos autores sealan
cuatro clases de tcnicas de anlisis de gradiente: 1. Anlisis de gradiente directo o regresin; 2. Anlisis de gradiente directo invertido o calibracin;

Adrin Escudero. Rosario Gaviln & Agustn Rubio

ltS

3. Anlisis de gradiente indirecto u ordenacin, y 4. Ordenacin forzada

(constrained ordination).
Al querer contrastar la abundancia de unas especies, en unas localidades
concretas con variables ambientales medidas en esos mismos lugares, se
puede recurrir a un amplio abanico de tcnicas, y cada una de ellas se puede
relacionar con alguna de las cuatro clases a las que hemos hecho referencia.
2. Regresin
Sin duda, la primera aproximacin y, seguramente, la ms sencilla se
puede hacer mediante tcnicas de regresin, las cuales describen la funcin
que mejor ajusta los valores de abundancia de una especie (variable dependiente) frente a una variable ambiental (variable independiente) en relacin
cori un modelo concreto; ste sera el caso de una regresin simple. Esta primera aproximacin es lo que se conoce como anlisis de gradiente directo
(WHITTAKER, 1967, 1978). Una posibilidad todava ms simple consistira en
la comparacin directa de los valores de la variable frente a los de abundancia
del taxon considerado (WI-IITTAKER, 1967). En TER BRAAK & LOOMAN
(1986), podemos encontrar un estudio exhaustivo de las tcnicas de regresin

en relacin con diferentes modelos estadsticos.


Sin embargo, cuando el inters se centra en el estudio de las relaciones de
las especies con un conjunto de variables que actan sobre ellas, es necesario
recurrir a otro tipo de tcnicas.
De forma casi intuitiva se nos ocurrira utilizar tcnicas basadas en coeficientes de correlacin, como puede ser el anlisis de correlacin cannica
(COR) (GAUCI-1 & WENTWORTI-l, 1976; GITTINS, 1985) o tcnicas relacionadas con ste, como el anlisis de variacin cannica (Canonical Variate
Analysis, CVA) (PIELOU, 1984; GIThNS, 1985). Pero stas presentan una
doble limitacin, por un lado, el hecho de asumir un modelo Linear de respuesta especies-variables, salvable mediante la introduccin de modelos polinomiales y, por otra parte, el hecho de que el nmero de especies deba ser

menor que el de localidades inventariadas, condicin que raramente se cumple en estudios de vegetacin. En este tipo de anlisis, las especies y las vanabes ambientales son consideradas de forma simtrica (TER BRAAK,
1987); sin embargo, Tso (1981) desarroll un modelo asimtrico en el que
las especies son explicadas por las variables. Esta ltima variante tiene un
comportamiento semejante al anlisis de redundancia (RDA), que se comentar ms adelante dentro de las tcnicas de ordenacin, pero del que se diferencia por la asuncin diferente del tipo de errores.
Otra alternativa ms elaborada estriba en la utilizacin de tcnicas de

,~>

gresin mltiple. Pese a las indudables ventajas tericas de dichas tcnicas,

Una breve revisin de tcnicas de anlisis multivariantes apliccibles en Pirc~soc.iologa

t7

que se han aplicado con xito en algunas ocasiones (YARRANTON, 1970;


AUSTN, 1971), nunca han llegado a ser populares en estudios de vegetacin.
Segn TER BRAAK (1987), las razones han sido: 1. Cada especie requiere un
anlisis individualizado, por si el nmero de especies no es muy reducido, el
esfuerzo a invertir puede ser considerable; 2. Los datos de vegetacin suelen
ser cualitativos o, si son cuantitativos, poseen muchos ceros, y en ninguno de
los dos casos es posible asumir una distribucin normal del error; 3. Las relaciones entre especies y variables ambientales son generalmente no lineares,
salvo que el segnento ambiental sea lo suficientemente corto; 4. Las varabIes ambientales estn a menudo fuertemente correlacionadas, por lo que en
muchas ocasiones es muy difcil separar su efecto conjunto (POTVIN &
ROFE, 1993). Tal como afirman AUSTN & AL. (1984), y TER BRAAK & LOOMAN (1986), algunos de estos problemas (2 y 3) se podran solucionar mediante la utilizacin de modelos obenidos por tcnicas basadas en el Modelado Linear Generalizado (GLM) (MCCULLAGI-I & NELDER, 1983), o sobre
todo modelos desarrollados a partir de tcnicas de Modelado Aditivo Generalizado (9AM), que son una exensin de las anteriores (YEE & MITCHELL,
1991). Estas permiten considerar distribuciones de los errores distintas de la
normal, como las que asuman las de Mxima Probabilidad (Maximum Likelihood). Probablemente esta va sea la ms adecuada para realizar un anlisis riguroso con el que determinar la forma de la curva de respuesta en relacin a un nmero de factores considerados simultneamente. En cualquier
caso, estos problemas pueden ser solventados mediante la utilizacin de tcnicas de ordenacin forzada, como veremos ms adelante.
3. Calibracin
Es el proceso inverso de la regresin, es decir el prpcedimiento que permite inferir valores para las variables ambientales a partir de la composicin florstica de cada localidad. Los tres mtodos utilizados ms habitualmente (TER
BRAAK, 1987) son:
1) Anlisis basado en las funciones de respuesta obtenidas previamente
mediante regresiones.
2) Regresin invertida, en la que las especies son las variables independientes (TER BRAAK & PRENTICE, 1988).
3) Anlisis basado en los valores indicadores de cada especie y posterior
ponderacin (Wcighted averaging) ver ELLEMBERG (1979) para su
confirmacin. TER BRAAK & I3ARENDREGT (1986) detallan el valor
de este ltimo procedimiento y su capacidad de emular modelos no lineales, condicin que limita notablemente a los procedimientos anteriores.

Adrin Escudero, Rosario Gaviln & Agustn Rubio

18
4.

Ordenacin

Bajo este trmno se agrupan varias tcnicas multivariantes que presentan


el denominador comn de reducir la dimensionalidad de una matriz de datos,
en nuestro caso floristicos, mediante la extraccin de ejes y sin que intervengan las variables ambientales (OAUCH, 1982; PIELOU, 1984; TER BRAAK,
1986; OKLAND, 1990; FEOLI & ORLCI, 199!). La interpretacin de estos
ejes en trminos ecolgicos se puede realizar en una segunda fase; es el denominado ANALISIS DE GRADIENTE INDIRECTO (WHITTAKER, 1967).
Tal como seala OKLAND (1990), conceptualmente existen tres aproximaciones diferentes a las tcnicas de ordenacin:
En primer lugar, geomtricamente, como mtodos de escalado (PRENTICE,
1977). En este sentido, estas tcnicas permiten sintetizar la informacin mediante la produccin de un espacio de ordenacin de pocas dimensiones donde
la disimilitud entre los inventarios en la matriz inicial es preservada (MINCHIN, 1987; TER BRAAK & PRENTICE, 1988). La bondad del ajuste se mide
mediante una funcin de estrs (PRENTICE, 1977). Dependiendo de la funcin
de disimilitud utilizada, del tratamiento que se d a estos valores, as como de
dicha funcin de estrs, podemos dividir las tcnicas de ordenacin en tcnicas de escalado mtrico (metric scaling techniques), tambin denominadas
Anlisis de Coordenadas Principales (PCoA), si se utilizan directamente los
valores de disimilitud para calcular el estrs, y tcnicas de escalado no mtrico (non-metric scaling techniques), silo que se utiliza es el rango de dichos
valores. Una tercera posibilidad es lo que se denominan tcnicas de escalado
hbrido (hybrid scaling techniques>O, y que combina tanto el valor de disimilitud como su rango (FAITH & AL,, 1987). Las funciones de similitud tambin
pueden ser utilizadas en este sentido (PODAN!, 1989a).
La segunda aproximacin que se puede realizar es de tipo estadstico, considerando los ejes de ordenacin como variables latentes o hipotticas, obtenidas de manera que se optimice el ajuste de los datos de las especies respecto a un modelo estadstico (lineal, unimodal, etc.) de respuesta de la abundanca de las especies a un gradiente dado (TER BRAAK & PRENTICE, 1988; TER
BRAAK, 1987). En este sentido, la tcnica de ordenacin busca la variable hipottica que mejor se ajusta de forma global a los datos de vegetacin de
donde partimos. Esta hipottica variable es el primer eje de ordenacin. Tal
como sealan TER BRAAK & PRENTICE (1988), las tcnicas de escalado mtrico pueden ser explicadas mediante ciclos de regresin y calibracin respecto de un modelo estadstico concreto. La conocida tcnica Anlisis de Componentes Principales (PCA) puede ser interpretada como un caso especial de
PCoA cuando la funcin utilizada es la Distancia Eucldea, ajusta los datos
segn un modelo linear; mientras que el Anlisis de Correspondencias (CA)
se ajusta heursticamente a un modelo unimodal (TER BRAAK, 1986).

Una breve revisin de tcnicas de anlisis multivariantes aplicables en Fitosociologa

19

La tercera aproximacin es de tipo algebraico. As, las tcnicas de ordenacin mtrica pueden ser consideradas como tcnicas capaces de obtener los
vectores propios (eigenvectors) que pueden ser tomados como variables
latentes y los correspondientes valores propios (eigenvalues) que dan
una idea de la bondad del ajuste entre los datos y las nuevas variables latentes
(ORLCI, 1978; PIELOU, 1984).
Aunque no las vamos a desglosar aqu, han surgido nuevas tcnicas de ordenacin, entre las que destacan las relacionadas con el desarrollo de los conceptos esgrimidos por la Fuzzy Set Theory (ROBERTS, 1987) y que se
basan en clasificaciones (FEOLI & ZUCCARELLO, 1986), o las aproximaciones ms avanzadas de IBM & OROENEWOUD (1975), GOODALL & JONHSON
(1982), etc.
5. Ordenaciones constreidas
De forma sinttica podemos afirmar que los anlisis de regresin sirven
para encontrar la variable ambiental que mejor explica la variacin de la cobertura de las especies en un conjunto de datos; mientras que en las ordenaciones, los ejes son las variables hipotticas que optimizan el ajuste de los
datos florsticos a un modelo estadstico dado. Una tercera cuestin, intermedia entre las anteriores, que tambin puede ser resuelta, es qu combinacin
de variables ambientales puede explicar dichos datos de una forma ms eficaz. Las ordenaciones cannicas u ordenaciones constreidas (TER BRAAK,
1986, 1987) pueden resolver este problema (TER BRAAK & PRENTICE,
1988). Estas tcnicas permiten conocer la combinacin de variables que explica mejor la variacin en la abundancia de las especies, optimizando el
ajuste de la abundancia de especies a un conjunto dado de variables ambientales (TER BRAAK, 1986; TER BRAAK & PRENTICE, 1988).
En cualquier caso, una aproximacin de este tipo se puede realizar recurriendo a anlisis de regresin mltiple, como ya indicamos en el apartado
correspondiente. La eleccin entre una regresin mltiple y una ordenacin
cannica depende de si consideramos ventajoso el hecho de analizar simultneamente todas las especies o no. En el caso de que se utilicen todas, como
ocurre en la ordenacin cannica, se asume que existe un modelo de respuesta comn, de manera que se extrae un reducido nmero de gradientes, denominados ejes en este sentido, es una ordenacin normal, para todas las especies; evidentemente, en los anlisis de regresin mltiple no ocurre as, en
dicho caso es necesario construir un gradiente particular para cada especie.
Por otro lado, la construccin de buenos modelos no lineales con tcnicas de
regresin no es sencilla, dado que la consideracin de combinaciones lineales
entre las variables complica mucho el proceso. Sin embargo, en este tipo de
ordenaciones la posible no linealidad entra de la mano de los distintos mode-

20

Adrin Escudero, Rosario Gaviln & Agustn Rubio

los que subyacen en cada una de las tcnicas de ordenacin: PCA asume modelos lineales; CA, modelos unimodales, y el resto de las tcnicas MDS
(Metric Dimensional Scaling), diferentes modelos segn la funcin de partida. En definitiva, las tcnicas cannicas requieren menos datos y son ms
fciles de aplicar que las de regresin, adems sus resultados dan una visin
mucho ms global. De todas formas, si lo que se pretende es una descripcin
ms detallada y precisa de las relaciones entre las plantas y las variables ambientales, es necesario recurrir a tcnicas de regresin mltiple (TER BRAAK,
1988).
Se han desarrollado las correspondientes versiones forzadas o constreidas para cada una de las tcnicas bsicas de ordenacin que hemos estudiado
en el apartado anterior La tcnica de ordenacin forzada correspondiente al
muy conocido Anlisis de Componentes Principales (PCA) se denomina
Anlisis de Redundancia (RDA) (RAO, 1964); la del Anlisis de Correspondencias (CA) se denomina Anlisis Cannico de Correspondencias (CCA)
(TER BRAAK, 1986, 1987), y las correspondientes a las tcnicas NMDS
(Non Metrie Dimensional Scaling) han sido desarrolladas por MEuLMANN
& HEISER (1984). Sin duda, hoy en da el CCA es la tcnica ms utilizada
por los investigadores para resolver problemas relacionados con los anlisis
de gradiente directo (ZHANG & OXLEY, 1994). El auge del CCA y este tipo
de tcnicas ha sido impresionante; BIRKS & AUSTN (1992) recogen 165 trabajos relacionados con el CCA y tcnicas afines entre 1986 y 1991.
Adems, pequeas modificaciones de estas tcnicas permiten obtener
nueva informacin. En primer lugar, los anlisis cannicos hbridos permiten
conocer la variacin florstica que permanece despus de que el efecto conjunto de las variables haya quedado ajustado (DAUDIN, 1980; YANAI, 1986; TER
BRAAK, 1988). En general, el nmero mximo de ejes forzados es igual al
de variables ambientales consideradas en el anlisis, pero siempre es posible
hacerlo sobre menos ejes (TER BRAAK, 1986; 1987), obteniendo a continuacin ejes de ordenacin parciales (TER BRAAK, 1988). Estos ejes representan
la direccin principal de variacin despus de que la informacin atribuible a
las variables consideradas ha sido extrada. La interpretacin de estos ejes responde a la siguiente regla: en caso de que la informacin de estos ejes fuera
mucho mayor que la acumulada y explicada por los anteriores, habra que pensar que las variables estudiadas no son eficaces a la hora de explicar la variabilidad florstica de los datos (TER BRAAK & PRENTICE, 1988).
En segundo lugar, las ordenaciones cannicas pa>ciales extraen la variabilidad introducida por variables ambientales que no presentan inters directo
para el investigador denominadas covariables o variables concomitantes
(DAVIES & TSO, 1982). De esta forma, los ejes de ordenacin representarn
nicamente el efecto atribuible a las variables de inters (TER BRAAK, 1988).
BORCARO (1992) y OKLAND & EtLERTSEN (1993) comentan el inters de

Una breve revisin dc tcnicas de anlisis multivariantes aplicables en Fitosociologa

21

estas tcnicas en estudios de vegetacin, sobre todo a la hora de reducir la variabilidad debida a los patrones espaciales (TER BRAAK, 1987; LEGENDRE &
FORTN, 1989), aunque tambin sirve para eliminar ruidos relacionados con
el muestreo (ESCUDERO. 1992).
Para la interpretacin de los ejes extrados se pueden utilizar los coeficientes cannicos o/y las correlaciones intragrupo (intra-set correlation).
Los coeficientes cannicos definen los ejes de ordenacin como combinacin lineal de las variables ambientales. Las correlaciones intragrupo son los
correspondientes coeficientes entre las variables y los ejes de ordenacin. Se
puede comprobar la importancia relativa en la extraccin de cada eje por
parte de cada variable sopesando ambos ndices. Los valores de los coeficientes cannicos slo tienen un valor exploratorio, ya que no pueden ser
probados (TER BRAAK, 1988; NANTEL & NEUMANN, 1992). Adems,
cuando un grupo de variables est muy correlacionado, los coeficientes de
correlacin se hacen muy inestables. Este problema se denomina multicolinealidad, y es semejante al que se presenta en el anlisis de regresin mltiple (MONTGOMERY & PECK, 1982; TER BRAAK, 1990). En general, este
problema se presenta con variables nominales (=<dummyvariables, MONTGOMERY & PECK, 1982). Por ello, siempre resulta recomendable estudiar
con antelacin el conjunto de variables ambientales para retirar tas que presenten correlaciones muy significativas. Posteriormente, estas variables que
presentan problemas de colinealidad pueden ser introducidas de forma pasiva en los diagramas de ordenacin, de manera que tambin puedan intervenr en la explicacin de los diagramas (TER BRAAK, 1988; TONTERI & AL.,
1990; FRANKLiN & MERLN, 1992).
Por ltimo, queremos sealar que estas tcnicas pueden dar diagramas de
difcil interpretacin cuando la correspondencia entre ambos conjuntos de
datos, florsticos y ambientales, es muy escasa (OKSANEN & 1-IUTTIJNEN,
1989). Este problema se puede solucionar gracias a una correcta eleccin de
las especies.
6. Premisas para trabajar con diagramas de ordenacin
En este apartado vamos a indicar algunas de las consideraciones que se
deben tener en cuenta al utilizar estas tcnicas numricas. Una posible rutina
de trabajo podra ser la indicada por TER BRAAK (1988), de manera que en
primer lugar se realiza una inspeccin de los datos mediante un CA, para que
se pueda ver hasta qu punto nuestros datos son unimodales o si, por el contrario, se ajustan a un modelo lineal; como ya hemos indicado, este punto es
crucial a la hora de decidimos por una tcnica de ordenacin u otra. Para ello,
HILL & GAUCH (1980) propusieron el uso de la desviacin estndar (SD,
standard units) de las curvas de respuesta de las especies respecto al gra-

22

Adrin Escudero, Rosario Gaviln & Agustn Rubio

diente determinado por dicho eje. Si esta longitud es superior a 3 unidades


SD, es recomendable utilizar mtodos no lineales (TER BRAAK & PRENTICE,
1988). Inversamente, si la longitud es inferior o igual a 2 SD, ser necesario
recurrir a mtodos lineales. Un ejemplo de la determinacin de la longitud
del gradiente mediante DCA lo podemos encontrar en TONTERI & AL.
(1990).
Recientemente, EILERTSEN & AL. (1990) han estudiado los efectos de las
manipulaciones habituales sobre los datos, como retirar especies de baja presencia (downweighting) y modificar el peso de las especies caractersticas,
comprobando que se producen fuertes modificaciones de la longitud del gradiente, lo cual cuestiona en cierta medida la validez de este estimador. Por
otro lado, JOHN & DALE (1990) han realizado con xito algunas aplicaciones
de CCA con gradientes muy cortos; ellos recurrieron a una simulacin de
Montecarlo para ver si el primer eje extrado era significativo. TER BRAAK
(1986) ya haba insinuado que, pese a todas las restricciones tericas, el CCA
podra funcionar bien con gradientes cortos, aunque es evidente que si los
vectores propios son muy cortos, los valores ptimos de muchas de las espectes caeran fuera de la regin inventariada y el comportamiento frente a las
variables empleadas puede ser considerado prcticamente lineal, por lo que
en cierta medida ambas aproximaciones se pueden hacer coincidentes. Sin
duda, las ventajas de los mtodos lineales, tanto de PCA como de RDA, en
este contexto, estriba en que sus biplots son mucho ms informativos que
los de (D)CA y (D)CCA, pero evidentemente esto se toma en inconveniente
cuando los datos son difciles de aproximar a modelos lineales. Tambin queremos sealar que la tolerancia de las especies es cercana a 1 50, por lo que
cada curva de respuesta (modelo gaussiano) puede alcanzar aproximadamente 4 SD (TER BRAAK, 1987), aunque MINO-UN (1987) habla de 6 SD. Por lo
tanto, es razonable pensar que muestras que presentan ms de esta longitud
no tienen especies en comn. Por supuesto, es necesario asumir que todas las
especies presentan un comportamiento gaussiano frente a los gradientes extrados. En cualquier caso podemos encontrar fuertes reticencias, de manera
que algunos autores consideran que ste no es el nico modelo de respuesta
especies-variables (MINO-UN, 1989; AUSTN & SMITH, 1989), argumento de
nuevo utilizado por estos autores cuando cuestionan la utilidad de las tcnicas
de ordenacin cannica, muy eficaces a la hora de aproximar los datos a
dicho modelo, aunque sea de una forma heurstica.
Respecto a las tcnicas que asumen modelos lineales, MINCHIN (1987)
tambin recogido por OKLAND (1990) llega a afirmar que no existe ninguna justificacin para utilizar un PCA con el propsito de realizar un anlisis
de gradiente indirecto. En cualquier caso, y dado que el espacio resuelto por
el PCA es de tipo eucldeo, su interpretabilidad, tanto en trminos fitosociolgicos como ecolgicos, puede ser mayor al haber una adecuacin entre el

Una breve revisin de tcnicas de anlisis multiva,-iantes aplicables en Fitosociologa

23

espacio original y los nuevos espacios generados (FEOLI & ORLCI, 1991);
por ello, algunos aulores (MAZZOLENI & AL., 1992; CASADO & AL., 1989)
consideran que su aplicacin puede ser muy ventajosa. En el extremo opuesto
podemos encontrar autores como FAITH & AL. (1987), que estiman que el espacio eucldeo permite medidas muy pobres de las distancias ecolgicas y
por consiguiente desaconseja el uso de un PCA.
Por otro lado estas tcnicas de ordenacin tambin pueden ser utilizadas
para detectar inventarios desviantes (outliers). Para localizar este tipo de
inventarios desviantes generalmente se han utilizado tcnicas de clasificacin
(GAUCH, 1982), sin embargo, coincidimos con WILDI (1989) en que es
mucho ms sencillo mediante el uso de tcnicas de ordenacin. El CA es muy
sensible a los invenlarios pobres en especies, situando estos inventarios en el
extremo del primer eje (GAUCH, 1982). En este sentido, es interesante comentar que un comportamiento muy desviante en estas ordenaciones no tiene
por qu reflejarse en las ordenaciones cannicas, debido a que las variables
ambientales que caracterizan el inventario no tienen por qu ser desviantes,
por lo que la deteccin de estos inventarios debe hacerse con tcnicas de ordenacin sencillas.
Para finalizar este apartado, queremos hacer referencia a los valores porcentuales de la varianza total que explica cada eje. Aunque tradicionalmente
estos valores han sido muy utilizados para explicar la cantidad de informacin acumulada por los ejes extrados, hoy en da tal interpretacin est en
desuso, ya que la informacin que pueden aportar es muy crptica. TER
BRAAK (1986, 1987) afirma que ese tipo de informacin slo se puede obtener a partir del tamao de los vectores directores, que varan de O a 1 en las
tcnicas derivadas de CA (JONOMAN & AL., 1987), o mejor an, utilizando la
desviacin estndar de dichos ejes con un test de significacin; adems, valores porcentuales muy bajos pueden dar diagramas muy informativos, y viceversa (GAUCH, 1982). De todas formas, hay que tener en cuenta que no es
posible obtener valores del 100% de varianza explicada, dado que siempre
hay un ruido de fondo debido a muy diferentes factores (GAUCH, 1982).
7. Interpretacin de los diagramas de ordenacin
Las ordenaciones originadas por cada una de las tcnicas que hemos comentado no se pueden interpretar siguiendo un nico esquema. En el caso del
PCA y tcnicas relacionadas metodolgicamente con l, tanto los inventarios
como las especies pueden ser representados en un mismo espacio (generalmente se utilizan espacios bidimensionales o planos), de manera que st unimos la posicin de una especie dada y el origen (0,0), tenemos lo que se ha
denominado ~<biplot(representacin simultnea de especies-localidades;
GABRIEL, 197!), en el que la direccin y mdulo de dichos vectores nos da

24

Adrin Escudero. Rosario Gaviln & Agustn Rubio

una idea de la direccin de la mxima variacin de la abundancia de una especie dada, y La longitud es proporcional a la intensidad del cambio (TER
BRAAK & PRENTICE, 1988). De forma sinttica podemos afirmar que las especies ms alejadas del centro son las ms inportantes a la hora de diferenciar las localidades (inventarios); en cualquier caso, existen reglas de carcter
cuantitativo para interpretar los diagramas de ordenacin de un PCA (TER
BRAAK, 1983).
En el caso de los diagramas de ordenacin obtenidos con un CA o tcnicas relacionadas con sta, las especies y las localidades son representadas por
puntos, siendo, en el caso de las localidades, el centro de gravedad de las especies que all aparecen y el de las especies una aproximacin a su ptimo
(modelo de respuesta unimodal). Las especies ms alejadas del origen no podemos saber si su ptimo cae dentro o no de nuestros diagramas, de manera
que en muchos sentidos estas especies pueden llevarnos a interpretaciones
errneas, ya que no podemos estar seguros de si su posicin es consecuencia
dc su preferencia por condiciones ecolgicas extremas dentro del tramo de
gradiente analizado o si simplemente obedece a su baja representatividad.
En TER BRAAK (1986; 1987; 1988) se explican detalladamente los procedimientos de obtencin e interpretacin de los diagramas producidos en un
CCA. De forma sinttica, las especies y localidades se representan por puntos; las variables cuantitativas, por vectores (interpretacin semejante a la de
los biplots de un PCA), y las variables nominales, por puntos que representan
sus centroides.
La interpretacin de estos diagramas puede ser implementada mediante la
utilizacin de nuevas tcnicas, apoyadas en el desarrollo del soffivare necesario. En este sentido destacan las tcnicas de interpolacin espacial (HAUSER
& MUCINA, 1991; TER BRAAK, 1987; HURGAZ & AL., 1993); as como las
basadas en la utilizacin de elipses de mxima probabilidad (FEOLI & LAGONEGRO, 1979).
8. El efecto de arco
A la hora de interpretar los diagramas, uno de los problemas ms importantes que nos podemos encontrar es consecuencia del llamado efecto de
arco (HILL & GAUCH, 1980). Si los datos de las especies se ajustan a un modelo unidimensional, el segundo eje extrado generalmente presenta una relacin parablica con el primer eje; esto ocurre en la prctica cuando el gradiente del primer eje es mucho mayor que el del siguiente. En definitiva, los
valores de las especies para el segundo eje van a formar un arco; caracterstica sta que nos permite identificar el problema sobre los diagramas de ordenacin, ya que las especies de comportamiento ms antagnico van a situarse
muy cerca en el plano de ordenacin. HILL & GAUCH (1980) desarrollaron el

Una breve revisin de tcnicas de anlisis multivariantes aplicables en Fitosociologa

25

DCA como una modificacin heurstica del CA. diseada para solventar este
problema. Se trata de un reescalado no lineal de los ejes, de manera que se intenta igualar la varianza interna en todos los puntos a lo largo del eje de ordenacin; los ejes son divididos en segmentos y se los expande o contrae segn
sea necesaro. Este mtodo de detrending ha sido criticado, por lo menos
para ciertas situaciones (OKSANEN, 1988; KENKEL & ORLCI, 1986; MINCHIN, 1987; PIELOU, 1984), y ha sido muy poco utilizado en aplicaciones
fuera del mbito de la ecologa (GREENACRE, 1984). TER BRAAK & PRENTICE (1988) y TER BRAAK (1988) consideran mucho ms ventajoso hacer un
detrending por el mtodo polinomial, mtodo que tambin fue esbozado
por HILL & GAUCH (1980). En cualquier caso, tambin podemos encontrar
autores reticentes a la hora de aplicar estas tcnicas. KNOX (1989) afirma que
no mejora sustancialmente a la tcnica primitiva. Esta situacin es la que
hace comentar a PIELOD (1984) y WARTENBERG & AL. (1987) que quiz sea
mucho ms adecuado recurrir exclusivamente a CA y detectar los autnticos
gradientes, pese a los inconvenientes que se puedan presentar. Aunque no
hemos hablado de ello, esta problemtica es extensiva a todo tipo de ordenaciones forzadas, aunque, segn PALMER (1993), el CCA es inmune a la mayora de los problemas que presenta el OCA.

CLASIFICACIONES NUMRICAS
Bajo esta denominacin s~ renen un conjunto de tcnicas denominadas
de agrupamiento capaces de generar clases diferentes unas de otras, cuyos
elementos son comunes dentro de cada una de ellas (DALE, 1988). Estas tcnicas permiten establecer una divisin de los conjuntos iniciales de datos de
una forma ms objetiva y menos intuitiva. En cualquier caso, la elevada cantidad de decisiones que el investigador debe tomar (tipo de algoritmo a utilizar, funcin de semejanza, transformaciones de los datos, etc.) puede cuestionar esta afirmacin (KO VAR & LEES, 1986; GOODALL & FEOLI, 1988).
En estudios de vegetacin y fundamentalmente en el contexto fitosociolgico estas tcnicas han sido utilizadas con profusin (MUCINA & VAN DER
MAAREL, 1989; KENT & BALLARD, 1988), pese a las reticencias manifestadas por algunos autores, que cuestionan la concepcin determinista y no-continua implcita en la mayor parte de las mismas (MINCI-IIN, 1987; AUSTN &
SMITH, 1989).
En este captulo vamos a presentar esquemticamente las tcnicas de agrupamiento y comentaremos brevemente algunos conceptos ms avanzados,
como son la determinacin del nivel ptimo de particin, la generacin de
clasificaciones consensuadas, la comparacin de dendrogramas y particiones,
etc. (Ver ANDERBERO, 1973; CLIFFORD & STEPHENSON, 1975; PlELOU,

26

Adrin Escudero, Rosario Gaviln & Agustn Rubio

1984; WEST}IOFF & VAN DER MAAREL, 1978; LEGENDRE & LEGENDRE,
1984; ORLCI, 1978; SNEATIII & SOKAL, 1973; MARDIA & AL., 1979; EVERITT, 1980).
1. Anlisis numrico de agrupamiento
La diversidad de tcnicas de agrupamiento existentes en la literatura
puede resumirse atendiendo a la estrategia clasificatoria que desarrollan en el
proceso. Siguiendo el criterio de WILLIAMS (1971), que usa una clave dicotmica para diferenciar las distintas tcnicas, la primera disyuncin se establece entre tcnicas de solcipamiento y de no solapamiento. En las primeras,
una entidad puede aparecer en ms de un grupo, razn por la cual han sido
poco utilizadas en ecologa (YARRANTON & AL., 1972), aunque a partir del
desarrollo de las tcnicas relacionadas con la Teora de los Conjuntos Difusos
(Fuzzy Set Theory>fl, su uso se est incrementando notablemente (ROBERTS, 1986; MARSILI-LIBELLI, 1989).
A su vez, las tcnicas de no solapamiento se dividen en enrnsecas o intrnsecas. Las primeras utilizan datos biticos y abiticos, tratando de relacionar ambos, mientras que las clasificaciones intrnsecas han sido empleadas

para formar grupos nicamente a partir de sus atributos. Estas ltimas, a su


vez, han sido divididas en jerrquicas y no jerrquicas. Segn WILLIAMS
(1971), lasjerrquicas siempre buscan una ruta entre la poblacin entera y el
conjunto de grupos individuales de que sta se compone, optimizando para
ello la relacin existente entre dos grupos cercanos. Por el contrario, en las
estrategias no jerrquicas se optimiza la estructura del grupo individual, que
es todo lo homognea que sea posible, no existiendo un camino definido
entre los grupos y la poblacin completa. Su valor estriba en que son capaces
de producir clasificaciones ptimas como consecuencia de la compactacin
individual de los grupos (CORMACK, 1971) y de la separacin que consiguen
entre los mismos (VAN TONGEREN, 1987). Adems, la multidimensionalidad
inicial de los datos puede ser poco compatible con la dimensin nica que se
establece en una clasificacin jerrquica (WHITTAKER, 1962; GALJCH &
WI-IITTAKER, 1981).
Los mtodos jerrquicos han sido muy utilizados por los taxnomos, de

una parte por su paralelismo con las teoras evolutivas, y de otra porque son
capaces de organizar el conocimiento adquirido (CLIFFORD & STEPHENSON,
1975) de manera que la jerarquizacin de los grupos permite establecer y conocer las relaciones que existen entre ellos (OAUCH, 1982).
Finalmente, los mtodos jerrquicos pueden dividirse en aglomerativos y
divisivos. Los mtodos divisivos pueden ser monotticos o politticos, mientras que los aglomerativos nicamente son politticos. Los mtodos divisivos
toman el conjunto de los datos como una entidad nica, dividindolo con

Una breve revisin de tcnicas de anlisis multivarianies aplicables en Fitosociologa

27

posterioridad; cada uno de los fragmentos obtenidos sufre el mismo proceso.


Los mtodos aglomerativos comienzan a unir los objetos de forma individual,
hasta llegar a tenerlos todos unidos. Tradicionalnente, las tcnicas divisivas
han sido consideradas ms eficaces que las aglomerativas, por lo menos
cuando se utilizaban con datos ecolgicos (HILL, 1979; OAUCH & WHITIAKER, 1981); sin embargo, algunos autores han puesto en duda, recientemente,
la eficacia de algunas de las tcnicas divisivas de uso ms extendido
(TWINSPAN) (VAN GROENEWOUD, 1992; BELBIN & MCDONALD, 1993),
mientras que otros resaltan la capacidad clasificatoria de las tcnicas aglomerativas (PODANI, 1989A; PIELOU, 1984).
Las tcnicas monotticas utilizan como criterio clasificatorio la presencia
o ausencia de una especie, mientras que las politticas utilizan criterios ms
numerosos. En general, se suelen utilizar ms profusamente estas ltimas, debido a que la presencia-ausencia azarosa de algunas especies puede introducir
importantes desviaciones (GOODALL, 1978), sobre todo si el nmero de especies o de inventarios es pequeo (HILL, 1977).
2. Mtodos jerrquicos aglomerativos
El nmero de tcnicas incluibles bajo este epgrafe es enorme, pero prcticamente la totalidad se deriva de la solucin combinatoria propuesta por
LANCE & WILLIAMS (1966, 1967), tal como expone PODANI (1989a), quien
adems agrupa estas tcnicas entre las que buscan la distancia mnima entre
grupos (~<clusters) (d-SAI-IN) y las que optimizan la homogeneidad intragrupo (h-SAHN; ~<Sequential,~<Aglomerative,~<Hierarchical>~,
Non overlapping). Entre los primeros, podemos destacar:
2.1. Enlace de grupos por el vecino ms cercano (single linkage
clustering>~)
Toma como distancia entre dos grupos aquella existente entre dos pares de
puntos, uno de cada grupo, cuya distancia sea la ms pequea de todas las posibles.
No es frecuente su uso en ecologa, debido al problema de encadenamiento que suele presentar, es decir, la tendencia a generar un crecimiento desde la
base a partir de un pequeo grupo (de dos inventarios, por ejemplo), al cual se
le une una sene de objetos, uno despus de otro, a modo de cadena. En un dendrograina de estas caractersticas es muy difcil para el usuario definir grupos
(PJELOIi, 1984). Sin embargo, debido a este efecto de encadenamiento es muy
utilizado para detectar objetos desviantes (~<outliers), ya que sern los que presenten mayores distancias frente al resto de los objetos y, por tanto, se unirn a

la parte final del dendrograma, donde podrn ser detectados (WILDI, 1989).

28

Adrin Escude,-o, Rosario Gaviln & Agustn Rubio

2.2. Enlace de grupos por el vecino ms lejano (~<complete linkage clustering)


La distancia entre dos grupos se basa en la que existe entre los dos puntos
ms alejados de cada uno de los gruposque se van a fusionar.
Tiene la ventaja de que los grupos obtenidos tienen un tamao parecido,
aunque su principal inconveniente estriba en que dos grupos vecinos que aparecen en el dendrograma separados a una gran distancia pueden ser muy similares. Por ello, es difcil detectar elementos desviantes. Segn LANCE & WILLIAMS (1967), el proceso conleva un alejamiento entre s de algunos grupos
y un acercamiento de otros, produciendo una sensacin muy marcada de dilatacin espacial en el conjunto de datos.
2.3, Agrupamiento por la unin media <average linkage clustering)
La distancia entre dos grupos se puede definir de cuatro formas diferentes,
que dan lugar a cuatro tipos de agrupamiento: la distancia media con o sin
carga (~<unweighted/weighted average distance, UPGMA/WPOMA). la distancia ente centroides (c<centroid distances>~, UPGMC) y la distancia entre
medianas (median distance- WPGMC). La dstancia entre centroides

puede considerarse sin carga, a diferencia de la distancia media. Este trmino


de carga se refiere al peso con el que cada objeto contribuye: en los anlisis
sin carga, cada objeto es vinculado al grupo con igual peso, aunque el peso de
un grupo es tratado de forma proporcional al nmero de elementos que contiene. Resultado de todo ello es que el centroide de dos grupos no es el punto
medio entre los centroides, sino que se acerca ms al grupo que contenga
mayor nmero de miembros (PIELOU, 1984).

Entre las tcnicas de las denominadas tcnicas h-SAI-IN, podemos destacar la siguiente:
2.4. Agrupamiento por varianza mnima (~<minimum variance clustering)
Su formulacin algebraica fue dada por BURR (1970). Se basa en la dispersin dentro de los grupos, que no es ms que la suma de los cuadrados de
la distancia entre cada punto y el centroide del grupo.
Es considerado, junto a los recogidos en el apartado anterior, como el que
produce la dicotoma de forma ms eficaz de entre todos los mtodos agIomerativos y el que mejor clasifica los inventarios de vegetacin que varan de
forma continua (FEOLI-CHIAPELLA & FEOLI, 1977; WILDI, 1989).
3. Mtodos divisivos
Cuentan con menos inconvenientes que los mtodos aglomerativos, ya
que en stos, al empezar a unir los objetos desde abajo, se corre el riesgo de

Una breve revisin de tcnicas de anlisis multivariantes aplicables en Fitosociologa

29

que en los primeros pasos del proceso de agrupamiento se realicen fusiones


errneas con influencia negativa en las posteriores. A pesar de ello, algunos
autores, como PIELOU (1984), consideran estas tcnicas menos eficaces que
las tcnicas aglomerativas descritas anteriormente.
Las aproximaciones ms ampliamente utilizadas comienzan realizando

una ordenacin de los datos, dividiendo despus los espacios resullantes y generando las correspondientes particiones. Este procedimiento es conocido
como ordenacin en espacio divisivo. Existe un gran nmero de mtodos
para realizar la ordenacin inicial, as como para situar los lmites de las particiones (GAUCH, 1982).
La ventaja de los mtodos divisivos consiste en que podemos parar el proceso de divisin en cualquier momento y no necesitamos continuarlo hasta
tener los objetos aislados completamente. Sin embargo, esto conleva un inconveniente, y es que se necesita una regla para decidir en qu momento se
detiene el proceso, lo cual no deja de ser arbitrario. Sin embargo, tambin se
ha trabajado para desarrollar algunos criterios con los que decidir cundo la
divisin ha llegado lo suficientemente lejos (PIELOU, 1977; DALE, 1988).
A continuacin, veremos algunos de los mtodos ms utilizados, haciendo
especial hincapi en el tercero de ellos, por su amplia utilizacion.
3.1. MTODO DL LA MNIMA EXTENSIN (Minimum spanning tree)
Se basa en el mtodo aglomerativo de unin por el vecino ms cercano
(~<single linkage clustering). Debe cumplir dos reglas: 1) cada par de puntos
se une, exclusivamente, por una l(nea; y 2) ninguna de las trayectorias puede
formar un conjunto cerrado. Previamente a la aplicacin del mtodo clasificativo, se realiza una ordenacin.
Tiene una gran utilidad cuando se realizan ordenaciones con reduccin de
la dimensionalidad, ya que dos objetos que en un espacio de s-dimensiones
(tantas como especies) aparecen alejados, al reducir la dimensin a dos pueden aparecer situados muy cerca, de ah que la sobreinipresin de un MST en

este tipo de diagramas sea de gran ayuda para detectar semejanzas no aparentes o diferencias enmascaradas.
3.2. PARTICIN DE UNA ORDENACIN POR PCA
a) El Mtodo partitivo de Lefkovitch consiste en realizar un PCA centrado. Esto implica que el origen de los ejes est en el centroide de la
nube de datos. La primera divisin se har, por lo tanto, rompiendo por
el primer eje de la ordenacin, y la segunda por el segundo eje, as
hasta finalizar el mtodo. Finalmente, se obtiene un dendrograma de si-

30

Adrin Escudero, Rosario Gaviln & Agustn Rubio

milares caractersticas a los aglomerativos. En cualquier caso, y dadas


las caractersticas intrnsecas de los biplots de un PCA, puede que
dicho problema no resulte tan severo.
Su principal desventaja es que puede inducir la dispersin de un grupo
que debera quedar unido, ya que puede ser descolocado por alguno de
los ejes principales. LEFKOVITCH (1976) sugiri varios mtodos para
realizar la verificacin del mtodo partitivo.
b) El Mtodo partitivo de Noy-Meir (1973) es parecido al anterior, pero a
diferencia de ste, el punto de corte se escoge en cada rotura. Esto se
realiza haciendo que la varianza dentro de los grupos de las coordenadas del eje principal para un grupo de puntos determinado sea lo ms
pequea posible. Evita los defectos del mtodo de Letkovitch. Sin embargo, tiene muchas similitudes con el agrupamiento de mnima varianza, anteriormente comentado, aunque no es la inversa de dicho m-

todo, ya que examinar todas las posibles divisiones de los puntos en


dos grupos, con objeto de encontrar con cul se obtiene la mnima
suma de la varianza dentro de los grupos, sera impracticable.
3.3. PARTICIN DE ORDENACIONES CA Y DCA
Uno de los mtodos clasificatorios (polittico, jerrquico y divisivo) ms

comnmente empleado (GANDULLO & AL., 1991; RETUERTO & CARBALLEIRA, 1991; FRANKLIN & MERLN, 1992) es el TWJNSPAN (TWo-way
INdicator Stecies ANalysis- HILL, 1979; HILL & AL., 1975). El TWINSPAN
fue diseado en principio para el tratamiento de matrices de datos florsticos,

clasificando simultneamente parcelas y especies. En este mtodo, los valores


de las parcelas y los valores de las especies se estiman por clculo de la
media recproca (R.A.O., ~<ReciprocalAveraging Ordenation). Es un mtodo ideado a partir del denominado anlisis de especies indicadoras (ISAHILL & AL., 1975), en el que se seleccionan cinco especies indicadoras con
las que, por un lado, se elabora una clave sencilla que puede ser usada en el
campo para asignar otras parcelas a sus clases apropiadas; y que adems, y
como aspecto ms interesante, reproducen fielmente la ordenacin completa
inicial con todas las especies. Con este mtodo, un grupo de parcelas se
puede singularizar mediante una combinacin de especies caractersticas o
diferenciales (OKLAND, 1990). El concepto cualitativo de especies diferenciales es transferido a datos cuantitativos mediante el desarrollo del concepto
de seudoespecies (HILL & AL., 1975). stas se definen por una abundancia
mnima de una especie. A dicho mnimo se le denomina nivel de corte. As
pues, el comportamiento medio de una especie responde al gradiente mantenido por las seudoespecies.

Una breve rev~in de tcnicas de anlisis multvariantes aplicables en Fitosoc.olc>ga

31

En este mtodo, la clasificacin de las parcelas emplea los primeros ejes


de una ordenacin de anlisis de correspondencia (CA) de las parcelas; primeramente lleva a cabo una clasificacin en dos grupos, aproximadamente a
partir de la mitad de la ordenacin, que se refina por una identificacin primera de especies indicadoras para cada poo del eje, con los que se obtiene
un primer valor preferencial para cada especie. Para cada una de las parcelas
se calcula el peso medio de los valores preferenciales, y ste sirve como base
para una reordenacin de las parcelas (ordenacin refinada) y para obtener
una dicotoma provisional. Repitiendo el proceso se consigue una ordenacin indicadora de los dos primeros grupos. Cuando se fija la dicotoma,
estos grupos se dan por definitivos y sobre cada uno de ellos se vuelve a repetir todo el proceso (HILL, 1979). Los grupos, en todos los niveles jerrquicos, son ordenados a lo largo del gradiente mayor de todas las especies, puesto que las ordenaciones realizadas en cada nivel dependern de niveles superiores (OKLAND, 1990).
La clasificacin de las especies por el TWINSPAN se lleva a cabo de la
mtsma manera que la clasificacin de las parcelas, y basndose en ella.
Esta metodologa presenta una gran versatilidad, ya que permite, siguiendo los criterios de DJGBY & KEMPTON (1987), obtener una clasificacin exhaustiva e imparcial, al menos inicialmente. Es posible asignar el mismo peso
a los diferentes niveles de seudoespecies y a los valores de los potenciales indicadores para los niveles de corte. Sin embargo, tambin permite fijar diferentes pesos a los niveles de seudoespecies y a los valores de los potenciales
indicadores, sin modificar notablemente los resultados obtenidos previamente, pero consiguiendo cambios que mejoran los resultados.
Finalmente, quisiramos comentar las tcnicas de clasificacin derivadas
de la denominada Teora de los conjuntos difusos (~<Fuzzy Set Theory, ZIMMERMAN, 1984), las cuales estn adquiriendo gran importancia en los estudios de vegetacin (ROBERTS, 1986; FEOLI & ZUCCARELLO, 1986, 1988;
MARSILI-LIBELLJ, 1989; ESCUDERO & PAJARN, 1994). Se trata de tcnicas
que permiten el solapamiento de los grupos de manera que los elementos
pueden pertenecer en mayor o menor medida a los diferentes grupos (DE
PATTA PILLAR & ORLCI, 1991), y por consiguiente, el establecimiento de
los lmites entre grupos no es tan severo como en las particiones que hemos
estudiado con anterioridad.
La eleccin entre el abanico de tcnicas de las que el investigador dispone
puede ser bastante complicado. Tal como sealan PJELOU (1984)o GOODALL
(1973), la eleccin debe basarse en las caractersticas intrnsecas de cada una
de ellas, o de las combinaciones de algoritmos, funciones de semejanza y posibies transformaciones de los datos, aunque quiz la mejor eleccin se relaciona con la interpretabilidad de los resultados (MUCINA & VAN DER MAAREL,

Adrin Escudero, Rc,sario Gaviln & Agustn Rubio

32

1989; MAZZOLENJ & AL., 1992). En cualquier caso, hoy en da todava son
necesarios estudios sobre medidas y mtodos (NOY-MEIR & VAN DER MAAREL, 1987). Existen tcnicas multivariantes de uso generalizado para comparar tanto dendrogramas como particiones (PODANI & DJCKINSON, 1984: PoDANI, 1989C; 1989D), cuyos resultados pueden ser utilizados para establecer
las relaciones entre ellos (PAULE & GMRY, 1987; PODANI, 1989B). Igualmente, es posible generar soluciones consensuadas a partir de diferentes dendrogramas y/o particiones (ROHL 1982; NEUMANN & NORTON, 1986; PoDANI, 1989D; ESCUDERO ET AL., 1994). En cuanto a la evaluacin de las clasificaciones y la detenninacin de las particiones ptimas, existe un gran nmero de trabajos en la literatura (DALE, 1988; VAN DER MAAREL, & AL.,
1978; POPMA & AL., 1983; ESCUDERO & PAJARN, 1994).

AGRADECIMIENTOS
El trabajo se ha beneficiado notablemente por los comentarios y consejos

realizados por el Dr. Fernndez-Gonzlez tras revisar las primeras versiones


del manuscrito.

REFERENCIAS BIBLIOGRAFICAS
ANDERBERcJ, MR. 1973. Cluster analysis applications. Academic Press. London.
AUSTN, MP. 1971. Role of regression analysis in plant ecology. flor. Eco!. Sor. Austr., 6:
63-75.
AUsTN, M. P., CUNN1NG}IAM, R. B. & FLEMtNG,P. M. 1984. New approach to direc gra-

dicnt anaysis using environmental scaars and statistical curve-fitting procedures. Vegetao, 55: 11-27.
AUsTN, M. P. & SMITH, T. M. 1989. A new nodel br the continuum concepr. Vegetacio, 83:

15-47.
BELBIN, L. & MCDONALD, C. 1993. Comparing threc cassificaion srategies for use in ecoIogy. i. Veg. 3d., 4(3): 341-345.
BIRKs, H. J. B. & AUSTN, H. A. 1992. An annotated bibliography of CCA and related constrained ordination methods. 1986-I991. University of Bergen, Norway.
BORCARO, D. 1992. Partiaing out the spatia component of ecological variation. E<.olcgy,
73(3): 1045-1055.

BRAUN BLANQLJET, J. 1964. Pflanzenso;ologie. Grundrge der vcgelationskunde. SpringerVerlag. Wicn.


BRAY. .1. R. & CURTs,]. 1. 1957. Art ordination of tite upand fores coinmunities of souihern
Wisconsin. Ecol. Monogr., 27: 325-349.
BUENO, A. & FERNNDEZ-PRIETO, .1. A. 1991. Acebuchales y lauredales de a costa carubulca. Lazaroa, 12: 273-201.
BURCAZ, A. R., FUERTES, E. & ESCUDERO, A. 1993. Ecology of cryptogamic epiphytes and
che cornifiunities in deciduous foress in mediterranean Spain. Vegetatio, 112: 73-86.

tina brcvc evisin de tcnicas de anlisis ,nultivarianes aplicables e Fitcsoc.iolcga

33

CAMPBELL, B. M. 1978. Similarity coefficients br classifying relevs. Vegetatio, 37: lOt109


CASADO, M. A.. ABBATE, G., BLASI. C. & PINEDA, F. D. 1989. Pattern divcrsity analysis of
clearing in aQuercus cerris wood. Vegecatio, 7<- 143-149.
CAl TELL. R. E. [952. Fcuor analvsis - an inp-oducvion an.d manual for 0w psyc.hologist cind
social .censt. Haiper. New Yo,-/<,
CAlltIl, R. E. 1966. The data box: is ordering of total rcsources in terms of possibLe retadonal systems. lo C.aaell. R. E. (cd.) Han.cibook ofmultivariate experimental psw.lc,lcgy: 67
[28. Rand McNally & Co. Chicago.
CLIEFORO. H. T. & SIEPHEN5ON, W. [975. An intirduction to nu,nerical c.lassjic:acion. Acadcn,ic Prcss. London.
CORMACK. R. 54. 1971. A review of classification. .1. Rov. Sta/isc. Sor., Ser. A. 134: 321-367.
CzEKANOWSKI. J. 1909. Zur diflerentialdiagnose der ncandertalgruppc. Korresponclenz-bla/r
deatch. Ges. Anibropol. Echnol. Urgesch., 40: 44-47.
CZEKANOWSKI..I. 1913. Zarys metod statystcznych w zastosowaniu do antropologii. Travaus

ce tcs socit cies ,Scien< es ce Varscwie. III. Clcissc cies scicnres ,ncitl,niaticues cc natujelles. nS.
DALE, 54. k. 1988. Knowing whcn [ostop: cluster concept-concept cluster. Coenoses, 1: 11-31,
DALE, M. E. & WEBR, L. J. 1975. Numerical methods lot the establishment of assocations.
Vegetatic .30: 77-87.
DAUDIN, 1. J. 1980. Pardal association measures and an applicacion lo qualitative regression.
Bic,rnetrika, 67: 581-590.
DAVIES, P. 1. AND Tso. 54. K. 5. [982. Procedures br reduced-rank rcgression. Appl. Scacisc,,
31: 244-255.
DE PArA PILLAR, V. & ORLCI, L. 1991. Fuzzy eomponents ir community level comparisons. lo Feoli, E. & Orlci, L. (eds.) Ccnnputcr assisted vegeta/ion analvsis: 87-97. Kluwer
Acaden,ic Publishcrs. Dordrecht.

DA! PINEDA. E. & GONzLEz BERNLDEZ. E. 1978. Descripcin automtica de la vegetacin II. Anlisis factorial cte datos cualitativos obtenidos en muestreos estratificados, Anales Edaf Agro., 37: 539-549.

DA!

PINEDA. F.. GONzLEZ BERNLDE!., E. & DE NICOLS, P. 1979. Descripcin automtica de la vegetacin III. Clasificacin y Ordenacin simultnea de datos cualitativos. Anales Eclaf Age.. 38: 2207-2224.
DIGBY, P. O, N. & KEMPTON, R. A. 39Sf,. Ma/fivas!ate anal vsis of ecologcal comrnnnmnex.
Chaprnan & Hall. London
EILERiSEN, O.. OKI.AND, R. H. OKLAND. T. & PEI)ER5EN, 0. [990. Data manipulation and

gradient lcngth estimation in USA ordination. J. 1/cg. Sc.!., : 261-270.


ELLEMI3ERU, It. 1979. Zeigerwerte der (iefssptlanzen Mitteleuropas.Scr. Geobot., 9:

1-121.

E5CtJDERO. A. 1992. Es/udic> fitoeccil giro de las c:c>rnunidades ruprolas x glercolas del ma<izo cAl Mcnzca va. Tesis doc. LS. C. 54. Madrid.
ESCUDERO. A.. GAVILN, R. & PAJARN, 5., 1994. Saxicnlous communities of the Siega del

Moncayo (Spain). A classificatory study. Coenoses 9: 3524.


ESCUDERO. A. & PArARON, 5. [994. Numerical Syntaxonomy of Asplenietalia petrarchae in
dic Iberian Peninsula. J. 1/cg. Srienrc, 5(2): 205-214.
EsIAHROOIK, 6. E. & ROGERs, D. J. 1966. A general meihod of taxonomie description for a
comrputed sinilarity measure. Bic>sciencc: 6: 789-793.
EvERIrr, B. 5. 1980. Cluster analvsis. 2nd Edition. Heinemano. London.
FArol. D. 1., MINCIIIN. P. R. & BEI.BIN,L. 1987. Compositional dissimilarity as a rohust measure of ecological - distance. Vegeta/lo. 69:57-68.
FEOLI. E. & LAGONEGRO, M. t979. Intersection anatysis in phytosociology: computer program aocI appticat.ion. lvcgc/atio. 40: 5.559.

34

Adrin Escudejo, Rosa,io Gaviln & Agustn Rubio

FECLI. E. & LAUSI, D. 1981. The [ogical basis of syntaxonomy in vegeration sciencc. In
Dierscbke, H. (ed.) Syntaxotiornie, 35-42. ]. Cramer. Vaduz.
FEOLI, E. & ORLCI, L. 1991. The properties and inerpretation of observations in vegetation
study. In Feoti, E. & Orlci, L. (eds3. Co~npiner assi,srer vegeation analy.sis: 3-13. Ktuwer
academic publisher. Dordrecht.
FEOLI, E. & ZUCCARELLO, y. 1986. Ordination based un classification: yet another solution?
Abs. Boj., lO: 203-219.
FEOLI, E. & ZLICCARELLO, V. 1988. Syntaxonomy: a source of useful fuzzy sets for environmental analysi s? Ccenoses, 3: 141147.
FEOLI-CHIAPELLA. L. & FEOLI, E. 1977. A nusnerical phytosociotogical .study of the summils
of tt~e Maicta massive (ttaty). Vegetcs/ic~, 34: 21-39.
FIsCI-IER, H. 5. & BEMMERLEIN, F. A. 1989. An outline of data analysis in phyrosociology:
past and presen. Vege/atio. St(I-2): 17-28.
FRANKLIN, J. & MERtIN, M. 1992. Species-environmerit pattems of forest vegetation on the
uplifted rec limestone of Atiu, Mangaia, Mauke and Mitiaro, Cook Island.]. Veg. Sci.,

3(I): 3-lS.
GABRIEL, K. R. 1971. The biplot display of matrices with application tu principal coniponents
analysis. Riomejrika, 58: 453-467.
GANDULLO. J. M., BAARES. A., BLANCO, A., CASTROVIEJO, 54., FERNNDEZ LPEZ, A.;
MUOZ, 1.; SNCHEZ PALOMARES, O. & SERRADA, R. 1991. Estudio ecolgico de la
laurisilva canaria. ICONA. Coleccin Tcnica. Madrid.
GAUCH. II. 0. 1982. Mulciva,-iate analysis in comniunitv ecology. Cambridge Uni. Press.

Canibrigde.
O. & WENTWORTI-I. T. R. 1976. Canonical correlation analysis as an ordination
technique. Vegetatio, 33: 12-22.

GAUd, H.

GAUCII. HO. & WHIJTAKER, R. H. 1981. Hierarchical elassification of community data. J.


Ecol., 69: 537-557.
GIITINS, R. 1985. Canonical analvsis. A review with applica/ions in ecologv. Springer-Verlag.

Berlin.
(iOODALI., D. W. 1973. Samples similarity and species correlarion. In Whittaker, R. H. (ed.)
Ordination anO classiflcation of c.ommunities: 105-156. Junk. The Hagne.
GOCDAt.I., D. W. 1978. Numerical classiflcatinn. 1n Whittaker, R. H. (cd.) Classificarion of
plant corninuni/ies: 247-286. iunk. The Hagne.
GOODALL, D. W. & FEOLI. E. 1988. Application of probabilistie niethods in the anatysis of
phytosocotogicat data Coenoses, 1: 1-9.
GOODALL, D. W. & JONHSON. R. W. 1982. Non linear ordination in several dimensions. A
maxinluin likelihood approach. Vegetacio, 48:197-208.
GOWER, J.C. 1971. A general coefflcient of similarity and sorne of jIs properties. Riometrics,
27: 857-871.
GREENACRE, 54. .1. 1984. Theory anc cppflc.ations of correspondence a,alvsis. Academic

Press. London.
HALSER. M. & MUCINA, L. 1991. Spatiat interpoltiort rnethods for interpretation of ordina-

tion diagrams. In Feoli, E. & Orlci, L. (eds.) Co,nputer assisted vegetacion analysis: 299316. Kluwer Academie Publishers. Dordrecht.
HILl., M. 0. 1977. Use of simple discrininant fnctions tu classify quantitative phyrosociological dala. In Diday, E.. t.gbert. L., Pages, J.P. & Tomassone, R. (eds.) First ,n/e-nat,onal
.cycnposium on Ocita analvsis anO infrr,natics; 18/ - /99. h,sticut de reehe,-cle cl in/ncnacique ej Jauornaxique. Le Chesnay.
HILL, M, 0. 1979. TWINSFAN A FORTRAN prograrn for arranging multivariate data in an
ordered two-way table by classificaton of itie individuat and attributes. Comet Univ. lthaca. New York.

Una breve revisin de tcnicas de anlisis rnultivariantes aplicable.s en Fitosociologa

35

HILL, O. 54., BUNCE, R. O. H. & SHAW, M. W. 1975. Indicator species analysis. A divisive
polythetie method of classification, and its applications to a survey pinewoods in Scotland.
.1. Leal., 63: 597-613.
HILL, M. O. & GAUCH, H. 0. 1980. Detrended correspondence analysis: an improved ordina<ion teehnique. Vegetado, 42: 47-58.
IIIM, P. & GROENEWOUD, H. 1975. A raultivariate ordering of vegetation based in Gatissian
type gradient response curves. 1. Ecol., 63: 767-777.
JACCARD, P. 1908. Nouvelles recherches sur la distribution florate. Bu!. Soc. vaudoise Sci.
nar,, 44: 223-270.
JOHN, E. A. & DALE., 54. R. T. 1990. Environmental correlates of species distributions in a saxicolous lichen community. J. Veg. Sci., 1: 385-392.
JONOMAN, R, H. 0., TER BRAAK, C. J. E. & VAN TONGEREN, O. F. R. 987. Data analysis
In (o,fl,nunitv anO landscape ecology. Pudoc, Wageningen.
KENKEI., N. C. & ORLCI, L. 1986. Applying metrie an nonmetric multidimensiona[ scaling
to ecological siudies sorne new results. Ecology, 67: 919-928.
KENT. NI. & BALI.ARD, J. 1988. Trends and problems in the applicarion of classification asJd
ordination methods iii plan ecolo. Vegetatio, 78: 109-124.
KNOX, R. 0. 1989. Etects of detrending and rescaling on con~espondence analysis: soludon
stability and accuracy. Vegetatio, 83: 129-136.
KOvARs, P. & LEP5, J. 1986. Ruderal eommunities of the railevay station. Cesk Trebov
(ea.stern Bohemia. Cbecoslovakia), remarks op Ihe applicarion of classiea] and numerical
methods of classification. Preslia, 58: 141-163.
JNSEN, 5. 1978. lntIuences of transformation of cover values op elassification and ordinarion
of lake vegetation. Vegetado, 37: 19-31.
LAMBERT, J. 54. & DALE, 54. B. 1964. The use of statistics in phytosoeiology. Adv. Eco!.
Res., 2:59-99.
LANCE, 0. N. & WILLIAMS, W. T. 1966. A generalizated sorting straegy for computer classifications. Nature. 212: 218.
LANCE, O. N. & WIt.LIAM5, W. T. 1967. A general theory of classificatory sorting strategies.
1. Hierarchical systems. ComputerJ., 9:373-380.
LUFKOViTCH, L. E. 976. I-Iierarchical clusreriag frora principal coerdinates: aH efficient mahod for small to very large numbers of objects. Math. Biosci., 31: 157-174.
LEGENDRE, P. & FORTN, J. 54. 1989. Spatial pattern and ecological analysis. Vege/atio, 80:
107-138.
LEGENDRE, L. & LEGENDRE, 1. 1983. Nurnerical ecology. Elsevier. Amsterdam.
Lni-s, 5. & HANDICOVA. V. >992. How rellaNe are our vegetation analyses. J. Veg. Sci., 3:
119-124.
MARDIA, K. V., KENT, J. T. & I3IBEY, J. M. 1979. Multivariate analysis. Academie Press.
London.
MARsILI-LIBELI. 5. 1989. Fuzzy clustering of ecotogical data. Coenoses, 2:95-106,
MAZZOLENI, 3., FRENcJi, D. D. & M/LES, .1. 1992. A cornparative study of classification arid
ordination mehods on succesional data. Coenoses, 7: 23-44
MCCULLAGH, P. & NELDER, i. A. 1983. Generalized linear inodels. Chapman and Hall. London.
MEULMANN. J. & HEISER, W. J. 1984. Constrained multidimensional sealirig: more directions
than dimensions. COMPSTAT. Phisica-Verlag. Vienna.
MINCHIN, P. R. 1987. Simulation of ruoltidimensional community patterns: towards a comprehensive model. Vegetatio, 71: 145-156
MINCHIN, P. R. 989. Montane vegetaion of the Mt. Field massif, Tasmania: a test of some
hypotheses about properties of community patterns. Vegetatio, 83: 97-1 lO.
MONTGOMERY, D. C. & PECK, E. A. 1982. Jntroduction to Linear Regression Analysis. John
Wiley. New York.

36

Adrin Escudero, Rosa rio Gaviln & Agustn Rubio

MORENO, .1. M.; PINEDA, E. D. & RIVAS-MARTNEZ, 3. [990. Ctimate aud vegetation al te
curosiberian-mediterranean boundary in the Iberiari Peninsula. J.Veg.Sci., 1(2): 233-244.
MLJC1NA, L.. RODWEI.L, 1. 5., SCHAMINE, J. 1-1. J. & DIER5CHKE, 11. 1993. European vegetation survey: current state of sorne national programmes. J. 1/cg. Sci. 4: 429-438.
MUCINA, L. & VAN DER MAAREL, E. 1989. Twenty years of numerical syntaxonomy. Vegetatct 89(12): 116.
NANTEL, P. & NEUMANN, P. 1992. Ecology of ectomycorrhizal-basidiomycete communities
Qn a local vegetation gradient. Ecology, 73(l): 99-117.
NEUMAN, D. A. & NORTON, V. T. 1986. Clustering and isolation in Ihe consensus problern
for partitions.,/. Class., 3:281-297.
NOY-MF.YR, 1. 1973. Data trawsforrnatieos lo ecotogyical erdination. 1. Sorne advantages en
non-centering. 1. Eco!., 61: 329-341.
NOY-rvIEYR, 1. & VAN DER MAAREL, E. t987. Relations between community theery aisd communiry analysis in vegetation scence: sorne historical perspeehives. Vegetado, 69: 5-15.
OCIIIAI, A. 1957. Zoogcografic sudies on the .soleois fishes found in Japan and ls neighbouring regions. Bu!. Jap. Soc, Sc]. Fislr, 22: 526-530.
OKLAND, R. H. 990. Vegetation ecology: theory. methods and applications with reference to
Fennoscandia. Sommer/=-lcia,suplement 1: 9-233.
OKLANI), R. H. & EILERT5EN. 0. 1994. Canonical Correspondence Analysis with varialion
partitioning: sorne cornments andan applieation.J. Veg.Sci.. 5(l): 127-138.
OK5ANEN, .1. 1988. A note on <he occasional inestability os detrending in correspondence
analysis. Vegetatio. 74: 29-32.
OK5ANEN, J. & HUTTUNEN, P. 1989. Finding a common ordinatior, for several data seis by individual differences scaling. Vege/acio, 83; 137-145.
ORLCI, L. 1967. An agglomerative method for classiflcaion of plan comnunities. J. Eco!.,
55: 193-205.
ORLCI, L. 1978. Multivariace analysis in vegeta/ion research. 2nd. ed. Junk, The Hague.
PALMER, MW. [993.Putting hings in even better order: the advantages of canonical correspondence analysis. Ecology, 74(8): 22 15-2230.
PAULE, L. & GMRY, D. >987. Comparison of different clustering methods applied lo matrices of genetie distances based 00 allelic frequencies. Abstr. Bot., 11:43-51.
PEINADO, M. & RIVAS-MARTNEZ, 5. 1987. La vegetacin de Espaa. Publicaciones de la
Universidad de Alcal de Henares. Madrid.
PIEI.OU, E. C. >977. Mathematical Ec.oiogy. Wiley. New York.
PIELOU, E. C. 984. The interpretation of ecological daca: a primer on c!assification anO ordination, Wiley & Sons. New York.
PODAN!, J. 1989a. New combinatorial cluslering methods. Vegetado, SI: 6>-??
PODANI. J. 1989b. Comparision of Fuzzy Classifications. Coenoses, 1: 17-21,
PODAN>, 1. 1989c. Comparision of classifications and ordinations of vegetalion dala.
Vegetado, 83: 111-128.
PODAN1, 3. 1989d. A meted ter generating corisensus pasrililoas and its applicaen te cernrnunity clasgification. Coenoses, 1: 1 lO.
PODANI, 3. & DICKIN5ON. T. A. 1984. Comparison of dendrograrns: a mutrivariate approach.
Can.]. Boj., 62: 2765-2778.
POPMA, 3., MUCINA. L., VAN TONGEREN, O. FR. & VAN DER MAAREL, E. 983. On <he determination of optimal levels in phyrosociological classiflcation. Vegecacio, 52: 65-75.
POTvIN, C. & ROFE, DA. 1993. Distribution-free and robust satistical methods: viable alernahives to parametrics staislics? Ecology, 74(6): 1617-1628.
PRENrICE, 1., 1977. Non-merrie ordination rnethods in ecology. .1. Ecol 65: 85-94
RAO, C. R. 1984. The use and inlerpretation of principal components analysis and applied research. Sankhva, 26 : 329-358.

Una breve revisin de tcnicas de anlisis mali!variantes aplicables en Fitosociologa

37

RETUERTO, R. & CARBALLEJRA, A. 1991. Deflning phytoelimatics units in Galicia, a Spain,


by mcans of muttivariate methods. .1. Veg. Sei. 2(5): 699-7 tO.
ROBERTs, D. W. 1986. Ordinationon the basis of fuzzy set theory. Vegetatio, 66: t23-l31.
ROc3ERS, U. J. & TANIMOTO, T. T. 1960. A coniputer program for classifying plans. Science
(Wash. D.C.) 132: 1115-IlIS.
ROHLF, E. J. 1982. Consensus indices for cornparing classifieaions. Mathernaricai
biosciences, 59: 131-144.
SCHWICKERATJ-l, M. 1931. Ole gruppenabundanz (gruppenmtlchtigkeit); cm beitrag zur begrifsbildung in derpflanzensoziologie. Englers Bot.,Jabr., 64: 1-16.
SNEATH, PH. A. & SOKAL, R. R. 1973. Numerical taxononiy. Freeman, San Francisco.
SOKAL, R. R. & MICHENER, C. D. 1958. A statistical rnethod for evaluating sysematic reationships. Unir Kan,ras Sc!. Bu!., 38: 1409-1433.
SOKAL, R. R. & SNEATI-I, P. H. A. 1963. PrincipIes of numerical taxonomy. WJ-l. Freeman.
San Francisco.
SORENSEN, T. 948. A meshod of estahlishing groups of equal amplitude in plant sociology
hased on similarity of species content and lis application te analysis of Ihe vegetation on
Dansh commons. Biol. Skr.. 5:1-34.
TARAZONA. T. 1984. Estudio florstico, ecolgico y fitosoc..iolgico de los ,narorraes del sector
ibrieo-so,-iano. Pub. lnst. Nac. tnv. Agrarias. Coleccin Tesis Doctorales, 45: 1-355. Madrid.
TARAZONA, T.: CALVO, P.;. ZALDIVAR. P. & MOREIRo, 5. 1991. Tipos biolgicos en la estructura de los hayedos espaoles. Doc. Phyrosoc,, 13: 247-280.
TER BRAAK. C. 1. F. 1983. Principal components biplots and alpha y beta diversity. Ecologv,
64: 454-462
TER BRAAK, C. J. F. 1986. Canonical correspondence analysis: a new eigenvector technique
for multivariate direc gradient analysis. Eco/ogy, 67: 1167-179.
TER BRAAK, Cl, F. 1987. The analysis of vegetation-environrnent relationships by canonical
correspondence analysis. Vegeratio, 69: 69-77.
TER BRAAK, C. 1. E. 1988. Partial canonical correspondence arlalysis. In Bock, H.H. (ed.).
ClassWcation metliods anO rea/cO tneihods c?f dala analvsis: 551-55K Amsterdam.
TER BRAAK, C. J. F. 1990. Updae notes: CANOCO version 3.10. Wageningen.
TER BRAAK, C. i. F. & BARENDREGT, L. 0. 1986. Weighted averaging of species indicator
values: jIs efficiency in environn,ental calibration. Mach. Biasc., 78: .57-72.
TER BRAAK, C. 1. E. & LOOMAN, C. W. N. 1986. Weighted averaging, togistie regression and
thc gaussian response model. Vegetatio, 65: 3-lI.
TER BRAAK, C. 1. E. & PRENTICE. 1. 988. A theory of gradien analysis. AtA. Eco!. Res., 18:
271-3 17.
TONTERI, T., MIICKOLA, K. & LAHTI, T. 1990. Compositional gradients in the fores vegetation of Finland..J. Veg.Sci., 1:691-698.
T50, 54. K. 5. 1981. Reduced-rank regression and canonical analysis. J. Roy. Starist, Soc.. 8.,
43: 183-189.
TXEN, R. & ELLEMBERO, H. 1937. Der systematische und kologische gruppenwert. Em
beitrag zur begriffsbildung und methodik der pflanzensociologie. Mirc. Flor. Soz. Arbeirsgem., 3:171-184.
VAN DER MAAREL, E. 1966. Over vegetafiestructuren, -relacies en- sysremen, in het hqzonder
in de duingraslanden van Voarne (With summary). Thesis (Jtrecht, 170 Pp.
VAN DER MAAREL, E. 1969. The use of ordination models in phytosociology. Vegetatio, 19:
21-46.
VAN DER MAAREL, E. 975. The Brauri-Blanquet approch in perspective. Vegetatio, 30(3):
2 13-219.
VAN DER MAAREL, E. 1981. Sorne perspectives of numerical methodsin syntaxonomy. tn
Dierschke, 1->. (ed.) Syntczxonomie, 77-93. i. Cramer. Vaduz.

38

AO,-in Escudero, Rosario Gaviln & Agustn Rubio

VAN DER MAAREL, E., JANSEN, J. O. M & LOUPPEN, 1. M. W. 1978. TABORD, a program
for structuring phytosociological laMes. Vegetatio,38: 143-J 56.
VAN GROENEWOIJD, lvi. V. 1992. The robustness of correpondence, detrended correspondence, and TWINSPAN analysis. J. Veg. Sci.. 3:239-246.
VAN TONGEREN, O. F. R. 1987. Cluster anatyss. la Jongman, k. H. O., Ter Braak, C. 1. E. &
van Tongeren, O. F. R. (eds4. Data anaiysis in cornmunicy anO landscape ecology. Pudoc.
Wageningen.
WARTENBERG, D., PERSON, 5. & ROI-ILF, Fi. 1987. Putting hings in order: a critique of detrendead correspendence ana!ysis. Arner. Nat., 129: 434-448.
WE5THOFF, V. & VAN DER MAAREL, E. 1978. The Braun-Blanquel approach. In Whittaker,
R. H. (ed.). Ordination ano Clasification of communities, 617-726. Junk. The Hague.
WHInAKER, R. H. 1962. Classification of natural communities. Boj. Rey., 28: 1-239.
WHITTAKER, R. 1-1. 1967. Gradient analysis of vegetado. Biol, Rey.. 49: 207-264.
WHITTAKER, R. 1-1. 1978. Direc gradien analysis. In Whittaker, R. H. (ed.) Ordinacion of
piant communities. iunk .The 1-1 ague 7-50
WILDI, 0. [989. A new numerical solution to traditional phytosociological tabular classification. Vegecatio, 81: 95-106.
WILDI, O. & ORLCI, L. 1990. Nuinerical e.rplora/ion of co,nniunicv pauerns. SPB Academie
Publishing, The Hague.
WILLIAMS, W. T. 1971. PrincipIes of clustering. Annu. Rey. Ecol. Svst., 2:303-326.
WILLIAM5, W. T. & LAMBERT, J. 54. 959. Multivariate methods in plan conimunities. 1. Association ana>ysis in plan communities. .1. Eco!., 47: 83-10>.
YANAI, II. 1986. Sorne generalizations of correspondence analysis in temis of projection operators. In Diday, E. & al. (eds.) Data Anaiysts anO Infrmatics 4:193-207. Amsterdam.
YARRANTON, O. A. 1970. Towards and rnaffiemaricat model of lime-stone pavement vegetation 111. Stimation of <he determinans of species frequencies. Can.]. Boj., 48: 1387-1404.
YARRANTON. 0. A., Beasleigh, W. 3., Morrison, RO. & Shafi, M. 1. 1972. On the ctassitication of phytosociological data into non-exclusive groups with a conjecture nbou detennining the optimun number of groups in aclassification. Vegetatio, 24: 1-12.
YEE. T. W. & MITCHELL, N. D. 1971. Generalized additive model in plan ecology. J. Veg.
Sci., 2: 587-602.
ZI-IANG J. & OXLEY, E. R. B. 1994. A coniparison of <bree mehods of multivariale analysis of
upland grasslands in North Wales. J. Veg. Sc!, 5(l): 71-76.
ZIMMERMAN, H. J. 1984. Fuzzy set theory anO fis applic.ations. Kluwer-Nijhoff Publishing.
Boston, Dordrecht.
Recibido 14 de febrero de 1994
Aceptado 28 de abril de 1994,

You might also like