You are on page 1of 5

TECNICAS MULTIVARIADAS Las tcnicas del anlisis multivariado (AM) tratan con datos asociados a conjuntos de medidas sobre

un nmero de individuos u objetos. El conjunto de individuos, junto con sus variables, pueden disponerse en un arreglo matricial , donde las filas corresponden a los individuos y las columnas a cada una de las variables. Las tcnicas del AM se distinguen de acuerdo con el trabajo por filas (individuos) y/o columnas (variables).

Algunos ejemplos de matrices de datos se presentan a continuacin. 1. Se est interesado en el anlisis de las notas de 6 reas de conocimiento, registradas para un grupo de 200 estudiantes que ingresan a una carrera tcnica; esta informacin se ). conforma en una matriz de tamao ( 2. La cantidad de azcar y colesterol presente en la sangre, junto con la edad, presin arterial sistlica, el hbito de fumar y el gnero conforman la historia clnica de 120 pacientes que ingresaron a un centro de salud con dolencias renales; esta informacin est contenida en una matriz de datos . Con esta informacin se quiere encontrar las posibles asociaciones entre estas variables. 3. Sobre 65 ciudades diferentes de una regin se emplean 7 indicadores de niveles de desarrollo; estos son: porcentaje de variacin de la poblacin 1995-2000, tasa de migracin neta 1995-2000, ingreso per cpita a 1995, poblacin econmicamente activa a 1995, habitantes por mdico en el ao 2000, densidad de carreteras a 2000 ( km por cien km2) y lneas telefnicas por 1000 habitantes a 2000. Estos datos se consignan en una ). matriz de tamao ( La mayora de las tcnicas multivariadas se dirigen a las filas, las columnas o las dos, de la matriz de datos. As, trabajar sobre las filas de la matriz de datos significa trabajar en el espacio de los individuos, es decir en . Anlogamente, las tcnicas estadsticas que trabajan sobre las columnas de la matriz de datos, estn en el espacio de las variables . Esquemticamente Individuos
p

np

Variables
n

Diferentes son los enfoques y metodologas seguidos en el anlisis multivariado. Algunos consideran stas dos metodologas: i) Los mtodos factoriales, los cuales consideran a los individuos y/o variables ubicados en espacios referenciados por coordenadas (factores).

ii) De otro lado estn las tcnicas de clasificacin, cuyo objetivo es la ubicacin de individuos de manera espacial de acuerdo con las variables que los identifican; mediante estos mtodos se consiguen mapas que ilustran el agrupamiento de los objetos. Otro enfoque de las tcnicas multivariadas considera que los objetos del anlisis y el tipo de datos obtenidos sugieren el tratamiento de la informacin. Dentro de esta visin se destacan las siguientes: i) Simplificacin de la estructura de datos. Tratan de encontrar una representacin reducida del espacio de las variables en estudio mediante la transformacin de algunas variables a un conjunto de menor dimensin.

ii) Clasificacin. Anlogo al primer enfoque, considera los individuos y las variables dispersos en un multiespacio; as el objetivo es encontrar una ubicacin espacial de stos. iii) Interdependencia. El propsito es estudiar la interdependencia entre las variables. Esta puede examinarse desde la independencia total de las variables hasta la dependencia de alguna con respecto a un subconjunto de variables (colinealidad). iv) Dependencia. Interesa hallar la asociacin entre dos conjuntos de variables, donde uno es considerado como la realizacin de mediciones dependientes de otro conjunto de variables. v) Formulacin y pruebas de hiptesis. Para un campo de estudio especfico se postula un modelo estadstico, ste queda definido por unos parmetros que deben ser estimados y verificados de acuerdo con la informacin recopilada. Bsicamente, se contemplan tres etapas: la formulacin, la estimacin y la validacin del modelo. Por considerar que los enfoques de dependencia el de interdependencia cobijan la mayora de metodologas multivariadas se esquematizan a continuacin stos dos.

MTODOS DE DEPENDENCIA 1. Regresin mltiple Se centra sobre la dependencia de una variable respuesta respecto a un conjunto de variables regresoras o predictoras. Mediante un modelo de regresin se mide el efecto de cada una de las

variables regresoras sobre la respuesta. Uno de los objetivos es la estimacin para la prediccin del valor medio de la variable dependiente, con base en el conocimiento de las variables independientes o predictoras. 2. Anlisis discriminante Conocidas algunas caractersticas (variables) de un individuo y partiendo del hecho de que pertenece a uno de varios grupos (poblacin) definidos de antemano, se debe asignar tal individuo en alguno de stos, con base en la informacin que de l se dispone. La tcnica del anlisis discriminante suministra los requerimientos y criterios para tomar esta decisin. 3. Anlisis de correlacin cannica Mediante este anlisis se busca una relacin lineal entre un conjunto de variables predictoras y un conjunto de criterios medidos u observados. Se inspeccionan dos combinaciones lineales, una para las variables predictoras y otra para las variables criterio (dependientes). Cuando hay ms de dos grupos se puede pensar en un anlisis discriminante mltiple como un caso especial del anlisis cannico. 4. Anlisis logit Es un caso especial del modelo de regresin, donde el criterio de respuesta es de tipo categrico o discreto. El inters se dirige a investigar los efectos de un conjunto de predictores sobre la respuesta, las variables predictoras pueden ser de tipo cuantitativo, categrico o de ambas. 5. Anlisis de varianza multivariado Cuando mltiples criterios son evaluados (tratamientos), y el propsito es determinar su efecto sobre una o ms variables respuesta en un experimento, la tcnica del anlisis de varianza multivariado resulta apropiada. De otra manera, la tcnica permite comparar los vectores de medias asociadas a varias poblaciones multivariantes. 6. Anlisis conjunto Es una tcnica que trata la evaluacin de un producto o servicio, con base en las calidades que de ste requieren o esperan sus consumidores o usuarios. Consideradas las caractersticas o atributos que el producto o servicio debe tener, el problema se dirige a obtener la combinacin ptima o adecuada de tales atributos. sta es una tcnica que combina el diseo experimental, el anlisis de varianza y las superficies de respuesta.

MTODOS DE INTERDEPENDENCIA Las tcnicas de anlisis de interdependencia buscan el cmo y el por qu se relacionan o asocian un conjunto de variables. En forma resumida las mundologas de este tipo son las siguientes:

1. Anlisis de componentes principales Tcnica de reduccin de datos, cuyo objetivo central es construir combinaciones lineales (componentes principales) de las variables originales que contengan una buena parte de la variabilidad total original. Las combinaciones lineales deben ser no correlacionadas (a veces se dice que estn incorrelacionadas) entre s, y cada una debe contener la mxima porcin de variabilidad total respecto a las subsiguientes componentes. 2. Anlisis de factores comunes El anlisis factorial describe cada variable en trminos de una combinacin lineal de un pequeo nmero de factores comunes no observables y un factor nico para cada variable. Los factores comunes reflejan la parte de la variabilidad que es compartida con las otras variables mientras que el factor nico expresa la variacin que es exclusiva de esa variable. De esta manera, el objetivo es encontrar los factores comunes que recojan el mximo de informacin de las variables originales. 3. Anlisis de correspondencias En el caso ms sencillo este mtodo est dirigido al anlisis de tablas de contingencia. Se intenta conseguir la mejor representacin simultnea de los dos conjuntos de datos contenidos en la tabla (filas y columnas); de ah el nombre de correspondencias simples o binarias. El anlisis de correspondencias mltiples se desarrolla sobre varias variables categricas, se considera una extensin de las correspondencias simples. Similar al anlisis de componentes principales, se tiene una matriz de datos, donde las filas son los individuos y las columnas cada una de las modalidades o categoras de las variables. 4. Anlisis de conglomerados Es otra tcnica de reduccin de datos. Su objetivo rs la identificacin de un pequeo nmero de grupos, de tal manera que los elementos dentro de cada grupo sean similares (cercanos) respecto a sus variables y muy diferentes de los que estn en otro grupo. El problema est en obtener una medida de distancia que garantice la cercana o similitud entre los objetos. 5. Escalamiento multidimensional Permite explorar e inferir criterios sobresalientes que la gente utiliza en la formacin de percepciones acerca de la similitud y preferencia entre varios objetos. Con escalas mtricas multidimensionales la similitud se obtiene sobre datos que tienen las propiedades de una mtrica; de tal forma que la similitud entre dos objetos decrezca linealmente con la distancia. Con el escalamiento no-mtrico se transforman las similitudes percibidas entre un conjunto de objetos en distancias, para ubicar los objetos en algn espacio multidimensional. Se asume que los datos slo tienen un rango ordenado, tal que las distancias son funciones montonas de stos. En resumen, el objetivo es la metrizacin de datos no mtricos por transformacin a un espacio mtrico.

6. Modelos log-lineales Con este tipo de modelos se puede investigar la interrelacin entre variables categricas que forman una tabla de contingencia o de clasificacin cruzada. Los modelos log-lineales expresan las probabilidades de las celdas en una tabla de contingencia mltiple en trminos de efectos principales e interaccin para las variables de la tabla. 7. Modelos estructurales

Aunque los modelos estructurales tienen aspectos de dependencia como de interdependencia, se considera como una tcnica multivariada separada de stas. Los objetivos de los modelos estructurales son tanto el modelamiento que permita descomponer las relaciones entre variables, a travs de un sistema de ecuaciones lineales, como la prueba de las relaciones de causalidad involucradas en las variables observables (manifiestas) y en las variables no observables (latentes).

You might also like