MultivaCorrelacion - CanónicaNilton Victor

METODOS MULTIVARIADOS
TEMA: ANLISIS DE CORRELACIN CANNICA

PROFESOR: Mg. MENACHO CHIOK CESAR
PRESENTADO POR: MACHICAO BEJAR NILTON Y
SANCHEZ CACERES VICTOR
1.- INTRODUCCION

Las correlaciones cannicas constituyen una generalizacin de las
correlaciones simples y mltiples. Las correlaciones simples estiman la relacin
existente entre dos variables, la independiente X con la dependiente Y. Las
correlaciones mltiples estiman la relacin entre un conjunto de variables
independientes (X
i
) y una sola variable dependiente (Y). Las correlaciones cannicas
estiman la correlacin existente entre un conjunto de variables independientes (X
i
) y
otro conjunto de variables dependientes (Y
i
).

Hasta hace pocos aos, el anlisis de correlacin cannica era una tcnica estadstica
relativamente poco utilizada. La disponibilidad de programas de computador a
facilitado el aumento de su uso en problemas de investigaciones tanto de carcter
sociolgico como pedaggico, sicolgico, satisfaccin, compra o volumen de ventas,
etc. Si las variables predictoras fueran exclusivamente categricas, se podra emplear el
anlisis multivariante de la varianza. Pero, qu ocurre si las variables predoctoras son
cuantitativas? La correlacin cannica es la respuesta, ya que permite la valoracin de la
relacin entre variables predictoras cuantitativas y mltiples medidas dependientes. En
general el anlisis cannico puede se expresado como:
Y
1
+ Y
2
+ Y
3
+ + Y
n
= X
1
+ X
2
+ X
3
+ + X
m

(cuantitativa, categrica) (cuantitativa, categrica)
2.- OBJETIVOS
1.-) Determinar las condiciones que se deben cumplir para la aplicacin del anlisis de
correlacin cannica.
2.-) Establecer cuantas funciones cannicas independientes se pueden definir entre los
dos conjuntos de variables originales (dependientes e independientes).
1
3.-) Determinar que mide la raz cannica y sealar sus limitaciones.
4.-) Comparar las ventajas y desventajas de los tres mtodos para interpretar la
naturaleza de las funciones cannicas.
3.- METODOLOGIA
Dados dos vectores de variables aleatorias Y
qx1
y X
sx1,
el Anlisis de Correlacin
Cannica se emplean para encontrar las combinaciones lineales en ambos conjuntos
que estn mayormente correlacionadas.
Sean Y
qx1
y X
sx1
dos vectores de variables aleatorias. Podemos suponer sin prdida de
generalidad que
0
x y

. Consideremos el vector
Y
X
_

,
Y sea
la matriz de covarianza de este ltimo vector. Entonces

yy yx
xy xx

1

1

]
Sean
Combinaciones lineales de las variables X y Y respectivamente.
Queremos encontrar simultneamente los vectores y que maximicen la
correlacin entre W y Z
Se tiene que:
2
Por conveniencia se introducen las restricciones
El problema de maximizar r
zw
sujeto a las restricciones anteriores se reduce a resolver
los dos sistemas de ecuaciones homogneas:
Donde I
b
e I
a
son matrices identidad sxs y qxq respectivamente.
Resolver el sistema anterior es equivalente a determinar los autovalores y autovectores
de las matrices
Se cumplen entonces las siguientes propiedades

3
Como resultado de este proceso se obtienen t pares de variables cannicas
(Z
j
, W
j
) con correlaciones j
, j = 1,2,3, . . . , t
Si se usan las matrices de correlacin
yy
,
xx
y
xy
, las variables cannicas son
funciones de las variables originales estandarizadas. Se obtienen los mismos
autovalores, pero los autovectores cambian.
Los autovectores j
y j
son llamados pesos cannicos. Cada peso cannico mide

el impacto marginal de cada variable sobre la variable cannica (cuando las otras
variables de la ecuacin permaneces fijas).
Los n valores de las nuevas variables (Z
j
, W
j
) correspondientes a las n observaciones
son llamadas los scores de las variables cannicas.
Aun cuando el desarrollo anterior corresponde a cantidades poblacionales, en la
prctica con este procedimiento se calcula la correlacin cannica basada en la matriz
de covarianza muestral.
4.- PRUEBAS DE HIPOTESIS SOBRE LAS CORRELACIONES CANONICAS
El conjunto de las correlaciones cannicas
i
puede que sea o no sea significativo. El
modo de conocer esa significatividad se realiza mediante la prueba A de Wilks y su
aproximacin a la distribucin
2
con sxq grados de libertad.
H
o
:
i = 0
H
a :
i > 0

s i
i
i
A
1
) 1 (

2

=
-(N -
) 1 (
2
1
+ + q s
)LnA
Si se dejan de considerar sucesivamente la primera, la segunda, etc. Correlaciones
cannicas podr conocerse en que momento las correlaciones ya no son significativas
teniendo en cuenta que
2
tendr (s -1)x(q 1) grados de libertad, (s 2)X(q 2) grados
de libertas, etc. En el caso de que exista significatidad, es decir, de que haya relacin
entre el primero y el segundo grupo de variables, los coeficientes (variables) cannicos
indican la importancia de cada variable, su aportacin al hecho de que exista esa
correlacin cannica determinada.

5.- PROCEDIMIENTO con R
4

El comando para realizar anlisis de correlacin cannica en R es
Cancor( x, y, xcenter = TRUE, ycenter = TRUE)
Donde:
a) x es una matriz de nxs que contiene las coordenadas de X.
b) y es una matriz de nxq que contiene las coordenadas de Y.
c) xcenter es una variable lgica o un vector de longitud s, el cual describe si deben
centrarse los valores de x antes del anlisis. Si es verdadero
(valor por defecto) se restan los promedios de cada columna; si es falso,
no se ajustan las columnas. En otro caso, se resta de las columnas el
vector suministrado.
d) ycenter es anlogo a xcenter.
El resultado es una lista que contiene los siguientes elementos:
a) cor: correlaciones
b) xcoef : coeficientes estimados para las variables x ( los
,
s ).
c) ycoef : coeficientes estimados para las variables y ( los
,
s ).
d) xcenter : valores usados para ajustar x.
e) ycenter : valores usados para ajustar y.
6.- APLICACIN Y DISCUSION
EJEMPLO 1
Los siguientes datos corresponden a 100 empleados bancarios, que incluye las
siguientes variables:
LCURRENT: Logaritmo del salario actual.
LSTART : Logaritmo del salario inicial.
EDUC : Nivel educativo ( en aos ).
SENIOR : Nivel del cargo en el banco.
AGE : Edad en aos.
EXPER : Experiencia de trabajo relevante en aos.
Deseamos seleccionar las variables de salario con el resto de las variables.
Los datos son:
LCURRENT LSTART EDUC SENIOR AGE EXPER
9.6853 9.0359 16 81 28.5 0.25
10.2524 9.7642 19 83 41.92 13
10.0345 9.2873 15 98 41.17 12
9.0848 8.3448 12 92 25.5 0.42
9.0143 8.4118 12 73 47.92 12.83
5
8.9464 8.1889 15 96 60.5 1.92
9.3038 8.3138 12 85 54.17 8.42

9.1881 8.3848 12 75 27.58 2.67
> banco.frm<- read.table("C:/data/banco.txt", header=T)
> banco.st<-(banco.frm-matrix(rep(apply(banco.frm,2,mean),100),
ncol=6, + byrow=T))/sqrt(matrix(rep(apply(banco.frm,2,var),100),
ncol=6,byrow=T))
> banco.cc<-cancor(banco.st[,1:2],banco.st[,-(1:2)])
> banco.cc
$cor
[1] 0.6140286 0.3804727
$xcoef
[,1] [,2]
LCURRENT 0.05568761 0.2121881
LSTART 0.04771206 -0.2141226
$ycoef
[,1] [,2] [,3] [,4]
EDUC 8.364626e-02 -0.03002320 0.043133164 0.03806646
SENIOR 1.126238e-05 0.07862576 0.059523322 -0.02359699
AGE -6.666894e-02 -0.05454486 0.077956508 0.09643948
EXPER 6.046272e-02 -0.02115222 -0.002239478 -0.13323648
$xcenter
LCURRENT LSTART
-1.848573e-15 -1.951772e-15
$ycenter
EDUC SENIOR AGE EXPER
-2.364775e-16 -2.669392e-16 -1.467576e-17 -1.255940e-17
Las correlaciones entre los dos primeros vectores cannicos son 0.6140286 y
0.3804727 respectivamente. Ambas parecen ser suficientemente altas como para ser
tomadas en cuenta.

La significacin de las dos correlaciones cannicas es:
H
o
:
i = 0
H
a :
i > 0

s i
i
i
A
1
) 1 ( = (1 - 0.6140286)(1 -0.3804727)= 0.239119819
6

2

=
-(N -
) 1 (
2
1
+ + q s
)LnA = -(100 - (4 + 2 + 1))Ln0.239119819

2
=
- 96.5 ( -1.43079051) = 138.071285
Como
2
(4*2) =
138.071285 > 18.465 al 99.9% de nivel de confianza,
entonces
la hiptesis nula de incorrecciones es rechazada.
Si deja de considerarse la primera correlacin cannica:
A = (1 - 0.3804727)= 0.6195273

2

=
-98.5Ln0.6195273 = 47.1616533
Como es significativo con (3*1) g.l. Entonces se consideran que las dos correlaciones
cannicas son significativas.
Los dos pares de variables cannicas basados en las variables estandarizados son:
Z
1
= 0.056LCURRENT + 0.048LSTART
W
1
= 0.084EDUC + 0.0001SENIOR 0.067AGE + 0.060EXPER
Z
2
= 0.212LCURRENT 0.214LSTART
W
2
= -0.030EDUC + 0.079SENIOR 0.055AGE 0.021EXPER
Z
1
es casi un promedio entre LCURRENT y LSTART, mientras que W
1
contiene
coeficientes positivos relativamente grandes para EDUC y EXPER y un coeficiente
negativo relativamente grande para AGE; por lo tanto, W
1
mide un contraste entre las
variables EDUC y EXPER y la variable AGE, de manera que mientras mayores sean los
valores de EDUC y EXPER relativos a AGE, mayor ser el valor de W
1
. La correlacin
positiva entre Z
1
y W
1
sugiere que el nivel de salario es mayor cuando la educacin y la
experiencia son altas con relacin a la edad.
Z
2
presenta ms bien un contraste entre el salario actual y el salario inicial. W
2
es
prioritariamente una funcin de AGE y SENIOR. Mientras mayor es el nivel en la
empresa relativo a la edad, mayor es W
2
. La correlacin positiva entre estas variables
sugiere que la diferencia entre el salario actual y el inicial ser mayor cuando el nivel
del empleado en la empresa es alto con respecto a la edad.
7
Tambien es til determinar las correlaciones entre las variables cannicas y cada una de
las variables usadas para el clculo de las mismas. Estas correlaciones se denominan
pesos cannicos o correlaciones estructurales.
En nuestro ejemplo:
> banco.cest<-cbind(cor(banco.st,as.matrix(banco.st[,1:2])%*%banco.cc$xcoef), +
cor(banco.st,as.matrix(banco.st[,-(1:2)])%*%banco.cc$ycoef[,1:2]))
> colnames(banco.cest)<-c("Z1","Z2","W1","W2")
> banco.cest
Z1 Z2 W1 W2
LCURRENT 0.97606212 0.21749193 0.59933004 0.08274975
LSTART 0.96724414 -0.25384792 0.59391555 -0.09658221
EDUC 0.54361718 -0.01787781 0.88532879 -0.04698841
SENIOR -0.01117106 0.27906634 -0.01819305 0.73347266
AGE -0.29384400 -0.20910255 -0.47855102 -0.54958617
EXPER -0.05539759 -0.20588514 -0.09021989 -0.54112983
Ntese que la matriz de correlacin estructural puede escribirse como:
Rxz
Ryz

1
]
1
Rxw
Ryw

Z
1
tiene alta correlacin con las variables relativas al salario, correlacin positiva alta
con EDUC y correlacin negativa dbil con AGE. Es decir, al aumentar el nivel
educativo el salario tambien aumentar. La correlacin de Z
2
con las variables relativas
al salario es bastante dbil, ya que Z
2
mide la diferencia entre ambas. Z
2
presenta
correlaciones negativas dbiles con AGE Y exper y correlacin positiva dbil con
SENIOR.
Con respecto a las variables explicativas, W
1
est altamente correlacionada con las
variables relativas al salario y con la educacin, y tiene correlacin negativa dbil con la
edad. W
2
presenta baja correlacin con las variables de salario, presenta correlaciones
negativas con edad y experiencia, y correlacin positiva relativamente alta con el nivel
en el banco.
8
EJEMPLO 2
Se tiene informacin de la actividad econmica de municipios de la Ciudad de
Granada(1995): Con estos datos se desea realizar un Anlisis de Correlacin Cannica,
de las variables econmicas en funcin de un conjunto de variables influyentes.

Y1 = Nmero de telfonos
Y2 = Nmero de turistas
Y3 = Consumo de energa elctrica
X1 = Superficie agraria
X2 = Nmero de cabezas de ganado
X3 = Empleo industrial
X4 = Nmero de licencias comerciales
X5 = Nmero de vehculos de transporte
Los datos son:
tel tur elec supagri cabgan empind liccom vehtrans
86 107 323 2309 267 0 12 157
167 230 658 5114 2607 0 15 314
4293 3854 29066 5524 2392 120 686 5581
...
196 256 866 2075 947 2 57 421
121 145 411 733 5849 0 9 182
1165 1176 7466 2936 3707 9 235 2024
3250 3610 17102 537 1192 27 430 5323
616 746 2709 2374 8831 13 90 1083
> turismo.frm<- read.table("C:/data/turismo.txt", header=T)
> turismo.st<-(turismo.frm-matrix(rep(apply(turismo.frm,2,mean),168), ncol=8,
byrow=T))/sqrt(matrix(rep(apply(turismo.frm,2,var),168), ncol=8,byrow=T))
> turismo.cc<-cancor(turismo.st[,1:3],turismo.st[,-(1:3)])
> turismo.cc
$cor
[1] 0.9999394 0.7520363 0.6231840
$xcoef
[,1] [,2] [,3]
tel -0.012518234 -2.30118307 1.2332115
tur -0.062530702 2.37489634 -0.6622364
elec -0.002361405 -0.07508306 -0.5759855
$ycoef
[,1] [,2] [,3] [,4] [,5]
supagri 0.0002954111 0.01658545 -0.001976328 0.0005682599 0.11628978
cabgan -0.0001026942 0.01929927 0.012940357 0.0755509421 -0.09288285
empind 0.0009463737 0.07025393 -0.070934243 -0.0355219456 -0.02622231
liccom 0.0042588514 -1.19854189 -0.160708811 0.3849038671 0.31463636
vehtrans -0.0817611587 1.17772871 0.167067795 -0.3958926237 -0.29555893
$xcenter
tel tur elec
-1.212758e-17 1.868958e-18 1.151319e-17
9
$ycenter
supagri cabgan empind liccom vehtrans
-1.318596e-17 -1.082137e-17 1.334085e-17 1.738079e-17 -6.784008e-18
H
o
:
i = 0
H
a :
i > 0
$cor
[1] 0.9999394 0.7520363 0.6231840

s i
i
i
A
1
) 1 (
=5.66226E-06
LnA=-12.08

2
(4*3)
=21

2

=
-(N -
) 1 (
2
1
+ + q s
)LnA= -(168-4)*(-12.08)=1981.12
Por tanto se rechaza Ho.
$cor
0.7520363 0.6231840
A = (1 - 0.7520363)(1-0.623184)= 0.09343669
2
(3*2)
= 12.592

2

=
-164*Ln0.09343669 = 388.76
$cor
0.6231840
A = (1-0.623184)= 0.376816

2

=
-164*Ln 0.376816 =-164*-0.976=160.064
2
(2*1)
= 5.991
Las correlaciones entre los tres primeros vectores cannicos son 0.9999394, 0.7520363
y 0.6231840
respectivamente. Las tres son suficientemente altas como para ser tomadas en cuenta.
Los tres pares de variables cannicas basados en las variables estandarizados son:
Z
1
= -0.013tel 0.063tur -0.002elec
W
1
= 0.0003supagri -0.0001cabgan +0.0009empind + 0.0043liccom -0.0818vehtrans
Z
2
= -2.301tel + 2.375tur -0.075elec
W
2
= 0.0166supagri +0.0193cabgan + 0.0703empind + -1.1985liccom + 1.1777vehtrans
10
Z
3
= 1.233tel -0.662tur -0.576elec
W
3
= -0.0020supagri + 0.0129cabgan -0.0709empind + -0.1607liccom + 0.1671vehtrans
Tambien es til determinar las correlaciones entre las variables cannicas y
cada una de las variables usadas para el clculo de las mismas. Estas correlaciones
se denominan pesos cannicos o correlaciones estructurales.
En nuestro ejemplo:
> turismo.cest<-cbind(cor(turismo.st,as.matrix(turismo.st[,1:3])%*%turismo.cc$xcoef),
+ cor(turismo.st,as.matrix(turismo.st[,-(1:3)])%*%turismo.cc$ycoef[,1:3]))
> colnames(turismo.cest)<-c("Z1","Z2","Z3","W1","W2","W3")
> turismo.cest
Z1 Z2 Z3 W1 W2
tel -0.99967842 -0.0242954254 0.007265496 -0.99961787 -0.0182710411
tur -0.99996950 0.0071381022 0.003169146 -0.99990893 0.0053681117
elec -0.99064752 -0.0602246186 -0.122435638 -0.99058751 -0.0452910975
supagri -0.06630017 0.2973301384 -0.104247030 -0.06630419 0.3953667535
cabgan -0.23363287 0.2247646856 -0.090917017 -0.23364703 0.2988747945
empind -0.14048030 0.1105585989 -0.607514932 -0.14048881 0.1470123230
liccom -0.99535734 -0.0340470290 -0.048148901 -0.99541764 -0.0452731209
vehtrans -0.99980548 0.0002981993 -0.009802384 -0.99986605 0.0003965225
W3
tel 0.004527741
tur 0.001974961
elec -0.076299936
supagri -0.167281289
cabgan -0.145891117
empind -0.974856362
liccom -0.077262730
vehtrans -0.015729516
Z
1
tiene alta correlacin negativa con el nmero de telefonos, nmero de turistas,
consumo de energa elctrica, nmero de locencias comerciales y nmero de vehiculos
de transporte y correlacin negativa dbil con el nmero de cabezas de ganado.

Con respecto a las variables explicativas, W
1
esta altamente correlacionada
negativamente con el nmero de telefonos, nmero de turistas, consumo de energa
elctrica, nmero de locencias comerciales y nmero de vehiculos de transporte y
correlacin negativa dbil con el nmero de cabezas de ganado.
CONCLUSIONES
El anlisis de correlacin cannica es una tcnica til y potente para explorar las
relaciones entre variables dependientes e independientes mltiples. La tcnica es ante
11
todo descriptiva, aunque puede ser empleada con fines predictivos. Los resultados
obtenidos a partir de un anlisis cannico deben dar respuestas a cuetiones relacionadas
con el nmero de maneras en las que se relacionan dos conjuntos de mltiples variables,
la validez de las relaciones y la naturaleza de las relaciones definidas.
El anlisis cannico posibilita al investigador combinar en una medida
compuesta, lo que de otra forma podra ser un gran nmero difcil de manejar de
correlaciones bivariantes entre conjuntos de variables. Es til para identificar relaciones
globales entre mltiples variables dependientes e independientes, especialmente cuando
el analista tiene poco conocimiento a priori sobre las relaciones entre los conjuntos de
variables. Fundamentalmente, el investigador puede aplicar el anlisis de correlacin
cannica a un conjunto de variables, seleccionar aquellas variables (tanto dependietes
como independientes) que aparecen ser significativamente relacionadas, y llevar a cabo
posteriores correlaciones cannicas con las restantes variables mas significativas, o
realizar regresiones con estas variables.

Al igual que cualquer otra tcnica multivariante, el Anlisis de Correlacin Cannica
debe estar sujeto a mtodos de validacin que aseguren que los resultados no son
solamente especficos de los datos de la muestra y que pueden ser generalizados a la
poblacin. El procedimiento ms directo es crear dos submuestras de los datos(si el
tamao muestral lo permite) y llevar a cabo el anlisis en cada submuestra de forma
separada. Despus, los resultados se pueden comparar para buscar la igualdad de las
funciones cannicas, las cargas de los valores tericos, y dems aspectos. Si se
encuentran importantes diferencias , el investigador debe considerar el realizar una
investigacin adicional para que los resultados finales son representativos de los valores
poblacionales , y no solamente de una nica muestra.
Otro enfoque consiste en evaluar la sensibilidad de los resultados a la eliminacin de
una variable dependiente y/o independiente . Dado que el procedimento de correlacin
cannica maximiza la correlacin y no optimiza la interpretabilidad , las cargas y las
ponderaciones cannicas pueden variar sustancialmente si una variable es eliminada de
algn valor terico. Para asegurar la estabilidad de las cargas y de las ponderaciones
cannocas el investigador debe estimar multiples correlaciones cannocas , en donde
en cada una se elimina una variable dependiente o independiente diferente.

12
Los pesos cannicos j
y j
representan el impacto o importancia marginal de cada

variable con las variables cannicas, cuando las dems variables se mantienen
constantes.

BIBLIOGRAFIA
1.-) Anlisis Multivariante. Hair-Anderson-Tatham-Black
Quinta Edicion. Prentice Hall.
2.-) Applied Multivariate Data Analysis. J.D. Jobson
Volumen II: Categorical and Multivariate Methods.
Springer.
3.-) Mtodos Multivariados Aplicados al Anlisis de Datos.
Dallas E. Johnson. Kansas State University. Thomson
Editores.
4.-) Tecnicas Estadisticas Multivariantes. Calvo Gmez,
Flix. Universidad de Deusto Bilbao.
13
APENDICE
Canonical Correlation Report
Page/Date/Time 1 12/12/2006 09:51:32 a.m.
Database
Atributos Variables EDUC, SENIOR, AGE, EXPER
Ingreso Variables LCURRENT, LSTART
Descriptive Statistics Section
Standard Non-Missing
Type Variable Mean Deviation Rows
Atributos EDUC 13.21 3.376374 100
Atributos SENIOR 81.45 10.37321 100
Atributos AGE 42.6843 12.23967 100
Atributos EXPER 11.4786 10.13314 100
Ingreso LCURRENT 9.499574 0.4418527 100
Ingreso LSTART 8.803166 0.3997492 100
Correlation Section
EDUC SENIOR AGE EXPER LCURRENT
EDUC 1.000000 0.042554 -0.305904 -0.249115 0.526716
SENIOR 0.042554 1.000000 0.070892 -0.011130 0.049791
AGE -0.305904 0.070892 1.000000 0.730363 -0.332288
EXPER -0.249115 -0.011130 0.730363 1.000000 -0.098850
LCURRENT 0.526716 0.049791 -0.332288 -0.098850 1.000000
LSTART 0.530349 -0.081646 -0.231139 -0.001319 0.888880
Correlation Section
LSTART
EDUC 0.530349
SENIOR -0.081646
AGE -0.231139
EXPER -0.001319
LCURRENT 0.888880
LSTART 1.000000
Canonical Correlations Section
Variate Canonical Num Den Prob Wilks'
Number Correlation R-Squared F-Value DF DF Level Lambda
1 0.614029 0.377031 8.70 8 188 0.000000 0.532788
2 0.380473 0.144759 5.36 3 95 0.001875 0.855241
F-value tests whether this canonical correlation and those following are zero.
14
Page/Date/Time 2 12/12/2006 09:51:33 a.m.
Database
Variation Explained Section
Canonical Variation Explained Individual Cumulative Canonical
Variate in these by these Percent Percent Correlation
Number Variables Variates Explained Explained Squared
1 Atributos Atributos 25.5 25.5 0.3770
1 Atributos Ingreso 9.6 9.6 0.3770
2 Atributos Ingreso 4.1 13.7 0.1448
1 Ingreso Atributos 35.6 35.6 0.3770
2 Ingreso Atributos 0.8 36.4 0.1448
1 Ingreso Ingreso 94.4 94.4 0.3770
2 Ingreso Ingreso 5.6 100.0 0.1448
Standardized Atributos Canonical Coefficients Section
Atributos1 Atributos2
EDUC 0.832270 -0.298727
SENIOR 0.000112 0.782316
AGE -0.663348 -0.542714
EXPER 0.601597 -0.210462
Standardized Ingreso Canonical Coefficients Section
Ingreso1 Ingreso2
LCURRENT 0.554085 2.111245
LSTART 0.474729 -2.130493
Variable - Variate Correlations Section
Atributos1 Atributos2 Ingreso1 Ingreso2
EDUC 0.885329 -0.046988 0.543617 -0.017878
SENIOR -0.018193 0.733473 -0.011171 0.279066
AGE -0.478551 -0.549586 -0.293844 -0.209103
EXPER -0.090220 -0.541130 -0.055398 -0.205885
LCURRENT 0.599330 0.082750 0.976062 0.217492
LSTART 0.593916 -0.096582 0.967244 -0.253848
15
Page/Date/Time 4 12/12/2006 09:51:33 a.m.
Database
Plots Section
-3.00
-1.75
-0.50
0.75
2.00
-2.00 -0.75 0.50 1.75 3.00
Scores Plot of Atributos1 vs Ingreso1
Ingreso1
A
t
r
i
b
u
t
o
s
1

-3.00
-1.75
-0.50
0.75
2.00
-4.00 -1.50 1.00 3.50 6.00
Ingreso2
A
t
r
i
b
u
t
o
s
1
-3.00
-1.50
0.00
1.50
3.00
-2.00 -0.75 0.50 1.75 3.00
Ingreso1
A
t
r
i
b
u
t
o
s
2

-3.00
-1.50
0.00
1.50
3.00
-4.00 -1.50 1.00 3.50 6.00
Ingreso2
A
t
r
i
b
u
t
o
s
2
16
Page/Date/Time 1 13/12/2006 05:13:09 a.m.
Database
Atributos Variables supagri, cabgan, empind, liccom, vehtrans
Tecnologia Variables tel, tur, elec
Descriptive Statistics Section
Standard Non-Missing
Type Variable Mean Deviation Rows
Atributos supagri 3916.899 6094.463 168
Atributos cabgan 4321.69 6186.358 168
Atributos empind 11.39881 23.97382 168
Atributos liccom 227.9167 1054.338 168
Atributos vehtrans 2089.589 10357.66 168
Tecnologia tel 1466.071 7973.249 168
Tecnologia tur 1486.452 7828.739 168
Tecnologia elec 8802.554 40684.88 168
Correlation Section
supagri cabgan empind liccom vehtrans
supagri 1.000000 0.738911 0.263391 0.087421 0.073041
cabgan 0.738911 1.000000 0.296573 0.259767 0.239511
empind 0.263391 0.296573 1.000000 0.210940 0.156106
liccom 0.087421 0.259767 0.210940 1.000000 0.996627
vehtrans 0.073041 0.239511 0.156106 0.996627 1.000000
tel 0.058298 0.227436 0.133335 0.995515 0.999406
tur 0.068090 0.234942 0.139340 0.994931 0.999746
elec 0.060537 0.229043 0.206890 0.993994 0.991637
17
Page/Date/Time 2 13/12/2006 05:13:09 a.m.
Database
Correlation Section
tel tur elec
supagri 0.058298 0.068090 0.060537
cabgan 0.227436 0.234942 0.229043
empind 0.133335 0.139340 0.206890
liccom 0.995515 0.994931 0.993994
vehtrans 0.999406 0.999746 0.991637
tel 1.000000 0.999498 0.990903
tur 0.999498 1.000000 0.989799
elec 0.990903 0.989799 1.000000
Canonical Correlations Section
Variate Canonical Num Den Prob Wilks'
Number Correlation R-Squared F-Value DF DF Level Lambda
1 0.999939 0.999879 1219.99 15 442 0.000000 0.000032
2 0.752036 0.565559 37.83 8 322 0.000000 0.265722
3 0.623184 0.388358 34.29 3 162 0.000000 0.611642
F-value tests whether this canonical correlation and those following are zero.
18
Page/Date/Time 3 13/12/2006 05:13:09 a.m.
Database
Variation Explained Section
Canonical Variation Explained Individual Cumulative Canonical
Variate in these by these Percent Percent Correlation
Number Variables Variates Explained Explained Squared
1 Atributos Tecnologia 41.4 41.4 0.9999
1 Tecnologia Atributos 99.3 99.3 0.9999
1 Tecnologia Tecnologia 99.4 99.4 0.9999
Standardized Atributos Canonical Coefficients Section
Atributos1 Atributos2 Atributos3
supagri -0.003818 -0.214331 -0.025540
cabgan 0.001327 -0.249402 0.167226
empind -0.012230 -0.907881 -0.916672
liccom -0.055036 15.488575 -2.076816
vehtrans 1.056587 -15.219609 2.158992
19
Page/Date/Time 4 13/12/2006 05:13:09 a.m.
Database
Standardized Tecnologia Canonical Coefficients Section
Tecnologia1 Tecnologia2 Tecnologia3
tel 0.161771 29.737839 15.936604
tur 0.808075 -30.690424 -8.557981
elec 0.030516 0.970287 -7.443373
Atributos1 Atributos2 Atributos3 Tecnologia1 Tecnologia2
supagri 0.066304 -0.395367 -0.167281 0.066300 -0.297330
cabgan 0.233647 -0.298875 -0.145891 0.233633 -0.224765
empind 0.140489 -0.147012 -0.974856 0.140480 -0.110559
liccom 0.995418 0.045273 -0.077263 0.995357 0.034047
vehtrans 0.999866 -0.000397 -0.015730 0.999805 -0.000298
tel 0.999618 0.018271 0.004528 0.999678 0.024295
tur 0.999909 -0.005368 0.001975 0.999970 -0.007138
elec 0.990588 0.045291 -0.076300 0.990648 0.060225
Tecnologia3
supagri -0.104247
cabgan -0.090917
empind -0.607515
liccom -0.048149
vehtrans -0.009802
tel 0.007265
tur 0.003169
elec -0.122436
20
Page/Date/Time 6 13/12/2006 05:13:09 a.m.
Database
Plots Section
-2.00
2.00
6.00
10.00
14.00
-2.00 2.00 6.00 10.00 14.00
Scores Plot of Atributos1 vs Tecnologia1
Tecnologia1
A
t
r
i
b
u
t
o
s
1

-2.00
2.00
6.00
10.00
14.00
-4.00 -1.00 2.00 5.00 8.00
Tecnologia2
A
t
r
i
b
u
t
o
s
1
-2.00
2.00
6.00
10.00
14.00
-8.00 -5.50 -3.00 -0.50 2.00
Tecnologia3
A
t
r
i
b
u
t
o
s
1

-4.00
-1.50
1.00
3.50
6.00
-2.00 2.00 6.00 10.00 14.00
Tecnologia1
A
t
r
i
b
u
t
o
s
2
Page/Date/Time 7 13/12/2006 05:13:09 a.m.
Database
-4.00
-1.50
1.00
3.50
6.00
-4.00 -1.00 2.00 5.00 8.00
Tecnologia2
A
t
r
i
b
u
t
o
s
2

-4.00
-1.50
1.00
3.50
6.00
-8.00 -5.50 -3.00 -0.50 2.00
Tecnologia3
A
t
r
i
b
u
t
o
s
2
21
-8.00
-5.00
-2.00
1.00
4.00
-2.00 2.00 6.00 10.00 14.00
Tecnologia1
A
t
r
i
b
u
t
o
s
3

-8.00
-5.00
-2.00
1.00
4.00
-4.00 -1.00 2.00 5.00 8.00
Tecnologia2
A
t
r
i
b
u
t
o
s
3
Page/Date/Time 8 13/12/2006 05:13:09 a.m.
Database
-8.00
-5.00
-2.00
1.00
4.00
-8.00 -5.50 -3.00 -0.50 2.00
Tecnologia3
A
t
r
i
b
u
t
o
s
3
22

MultivaCorrelacion - CanónicaNilton Victor

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

MultivaCorrelacion - CanónicaNilton Victor

Uploaded by

Copyright:

Available Formats

METODOS MULTIVARIADOS

TEMA: ANLISIS DE CORRELACIN CANNICA

la matriz de covarianza de este ltimo vector. Entonces

son llamados pesos cannicos. Cada peso cannico mide

9.3038 8.3138 12 85 54.17 8.42

representan el impacto o importancia marginal de cada

You might also like