You are on page 1of 118

i

REINALDO FRANCISCO TEFILO


Mtodos Quimiomtricos: Uma Viso Geral
Conceitos bsicos de quimiometria
Viosa - MG
Maio de 2013



ii
Caro Leitor,

Se voc usar este material, por favor, cite-o em suas referncias.

Citar a tese de doutorado que deu origem a este texto:
R.F. Tefilo, Chemometric methods in the electrochemical studies of phenols on boron-doped
diamond films, Universidade Estadual de Campinas, Campinas, 2007.

Ou simplesmente este texto:

R.F. Tefilo, Mtodos Quimiomtricos: Uma Viso Geral - Conceitos bsicos de quimiometria,
Universidade Federal de Viosa, Viosa, Vol. 1, 2013.



iii


Introduo

Tefilo, R. F. 1
Introduo
A anlise de dados multivariados tem se tornado, de modo crescente, uma
importante rea da qumica e de outras cincias [1,2]. Isto sugere que a tendncia
atual do pensamento cientfico envolve um raciocnio multivariado [1,3],
principalmente devido ao desenvolvimento tecnolgico atingido neste ltimo
sculo [1].
Historicamente, a anlise de dados multivariados em qumica tem utilizado
ferramentas desenvolvidas na rea de cincias sociais como economia
(econometria) e psicologia (psicometria). Apesar de serem interpretadas para
objetivos especficos em cada rea, a maioria destas ferramentas se baseia em
sofisticados mtodos matemticos, estatsticos, computacionais e de lgica formal
[2,4]. Em qumica, as anlises multivariadas so teis para (1) planejar ou
selecionar procedimentos experimentais timos; (2) extrair o mximo da
informao qumica relevante pela anlise dos dados; e (3) obter conhecimentos
sobre os sistemas qumicos estudados [5].
Com a aplicao destas ferramentas sobre dados fundamentalmente obtidos
nas reas da qumica, nasceu uma nova disciplina designada por Svante Wold em
1972, de quimiometria [6]. De uma maneira filosfica, se partirmos do ponto de
vista de que a quimiometria , teoricamente, a aplicao de quaisquer mtodos
matemticos e estatsticos para o tratamento de dados qumicos, a quimiometria se
inicia em 1772 com Lavoisier, que deve ser considerado o primeiro quimiometrista,
por ter sido o primeiro a usar mtodos quantitativos em qumica [6]. Porm, h um
consenso geral de que a quimiometria se iniciou por volta de 1970 com diversos
trabalhos cientficos, livros e um simpsio, ocorrido em So Francisco, em 2 de
setembro de 1976 [7], todos direcionados para a anlise multivariada de dados
qumicos. O grande divulgador e entusiasta internacional desta nova disciplina foi,
sem dvida, Bruce Kowalski [6,8]. Foram dele os primeiros trabalhos, a primeira
Introduo

Tefilo, R. F. 2
comunicao por escrito dirigida aos qumicos anunciando esta nova rea e o
primeiro livro editado na rea [9].
A criao desta nova disciplina ocorreu, principalmente, devido automao
dos laboratrios com o aumento significativo no nmero de instrumentos analticos
que fornecem dados multivariados, ou seja, mtodos que geram mais de uma
medida para uma dada amostra [10]. Alm disso, outras importantes contribuies
foram: a acessibilidade a microcomputadores e a disponibilidade de metodologias e
softwares dedicados realizao de clculos com dados multivariados [4].
Atualmente a quimiometria est suficientemente estabelecida e seu uso
disseminado [11]. Cada vez mais, metodologias quimiomtricas esto sendo
aperfeioadas e/ou desenvolvidas de maneira direcionada para os problemas de
origem qumica [12,13].
Dentre as reas tradicionais da qumica, a qumica analtica , atualmente, a
mais influenciada pela quimiometria [4]. Dentre as diferentes tcnicas analticas, as
ferramentas quimiomtricas se tornaram mais populares na rea de espectroscopia
[14].
Este texto tem como objetivo mostrar os conceitos bsicos dos mtodos
quimiomtricos mais utilizados. O leitor interessado poder, aps dominar estes
conceitos, explorar novos, aplic-lo e desenvolver novos mtodos. Bem vindo ao
mundo da quimiometria.
Referncias
1. Rencher, A. C. Methods of multivariate analysis. 2nd ed.; John Wiley & Sons Inc: New
York, 2002.
2. Phatak, A. Evaluation of some multivariate methods and their applications in chemical
engineering. University of Waterloo, Ontario, 1993.
3. Workman, J. J.; Mobley, P. R.; Kowalski, B. R.; Bro, R. Review of chemometrics
applied to spectroscopy: 1985-95 .1. Appl. Spectrosc. Rev. 1996, 31, (1-2), 73-124.
4. Brereton, R. G. Chemometrics: Data Analysis for the laboratory and chemical plant.
John Wiley & Sons Inc: Chinchester, 2003; p 407.
5. Massart, D. L.; Vandeginste, B. G. M.; Buydens, L. M. C.; de Jong, S.; Lewi, P. J.;
Verbeke-Smeyers, J. Handbook of Chemometrics and Qualimetrics. Elsevier:
Amsterdam, 1998; Vol. Part A, .
Introduo

Tefilo, R. F. 3
6. Esbensen, K.; Geladi, P. The start and early history of chemometrics - selected
interviews .2. J. Chemometr. 1990, 4, (6), 389-412.
7. Sheperd, P. Retrospective. J. Chemometr. 1987, 1, 3-6.
8. Geladi, P.; Esbensen, K. The start and early history of chemometrics .1. selected
interviews. J. Chemometr. 1990, 4, (5), 337-354.
9. Kowalski, B. R. Chemometrics: Theory and Application. ACS Symp. Ser.: New York,
1977; .
10. Richards, E.; Bessant, C.; Saini, S. Multivariate data analysis in electroanalytical
chemistry. Electroanalysis 2002, 14, (22), 1533-1542.
11. Lavine, B. K.; Workman, J. Chemometrics: Past, present, and future. 2005, 894, 1-13.
12. Hopke, P. K. The evolution of chemometrics. Anal. Chim. Acta 2003, 500, (1-2), 365-
377.
13. Hasegawa, T.; Ozaki, Y. New development in chemometrics. Bunseki Kagaku 2005,
54, (1), 1-26.

Introduo

Tefilo, R. F. ii

Ns somos o que repetidas vezes fazemos.
Excelncia ento, no um ato, mas um hbito
Aristteles

Tefilo, R. F. 3
Os Mtodos Quimiomtricos
Embora muitos mtodos quimiomtricos tenham originalmente sido
desenvolvidos na rea de cincias sociais, elas agora esto sendo aplicadas quase
que como um procedimento de rotina na anlise de dados oriundos de sistemas
qumicos. Assim, fica bem definido que a Quimiometria no uma disciplina nem
da matemtica, nem da estatstica ou da computao, mas sim da qumica. Os
problemas que ela se prope a resolver so de interesse e originados na qumica,
ainda que as ferramentas de trabalho provenham principalmente da matemtica,
estatstica e computao [1].
Informaes qumicas tais como, voltamogramas, espectros, cromatogramas,
curvas de titulao e outras fontes podem ser digitalizadas formando uma srie de
nmeros que podem ser representadas como vetores e matrizes [2]. Em
quimiometria, os processamentos destes dados exigem, na maioria das vezes,
operaes algbricas bem definidas. Portanto, torna-se necessrio padronizar as
notaes e convenes destas operaes para em seguida apresentar as
metodologias quimiomtricas. Neste material sero discutidas as notaes,
convenes e alguns pr-processamentos, alm dos seguintes mtodos
quimiomtricos: (1) planejamento e anlise de experimentos; (2) anlise de
componentes principais (PCA); (3) regresso multivariada empregando quadrados
mnimos parciais (PLS); (4) metodologias de seleo de variveis em calibrao
multivariada; (5) clculo do sinal analtico lquido (NAS) para calibrao
multivariada inversa e estimativas de parmetros analticos (figuras de mrito); (6)
anlise dos fatores paralelos (PARAFAC) e (7) regresso em multimodos i.e., PLS
multilinear (N-PLS).


Tefilo, R. F. 4
Notaes, Convenes e alguns Pr-Tratamentos
Em toda a tese, as notaes e convenes listadas abaixo sero seguidas.
Outras notaes especiais sero introduzidas quando necessrias. Ainda neste
subttulo, alguns pr-tratamentos que sero empregados em quase toda tese, sero
descritos.
- Variveis e amostras
Vetores podem ser definidos como uma seqncia de escalares (nmeros),
matrizes como uma seqncia de vetores e tensores como uma seqncia de
matrizes. Estas estruturas so apresentadas na Figura 1.1..

Figura 1.1. Ilustrao do escalar, vetor, matriz e tensor. O crculo fechado ()
representa as posies do elemento no vetor (1), na matriz (1,1) e no tensor (1,1,1). As
setas indicam que h escalares em todas as outras posies.
A Tabela 1.1 representa uma matriz de dados com I linhas e J colunas. Por
definio, nas colunas de uma matriz X(IJ) esto dispostas as J variveis e nas
linhas esto as I diferentes amostras.
Usando voltamogramas como exemplo, a Tabela 1.1 pode ser construda da
seguinte maneira: as variveis (1,2, ,J) seriam os potenciais investigados; em
cada posio das amostras (1,2, ,I) estariam as indicaes dos diferentes
voltamogramas e cada posio dentro do quadrado pontilhado (x
ij
) estariam as
correntes obtidas em cada potencial.

Tefilo, R. F. 5
Somente os nmeros presentes dentro do quadrado pontilhado na Tabela 1.1
fazem parte do nico ou de um dos blocos considerados para a realizao de
clculos quimiomtricos.
Tabela 1.1. Representao esquemtica de uma matriz de dados.
Variveis
Amostras 1 2 J
1 x
11
x
12
x
13
x
1J

2 x
21
x
22
x
23
x
2J


I x
I 1
x
I 2
x
I 3
x
I J


- Escalares
Um escalar um nmero que em qumica pode representar uma medida
representativa (Figura 1.1). Em voltametria, por exemplo, ao obter uma corrente de
pico, temos um nmero que a corrente.
Os escalares sero indicados por letras minsculas em itlico, podendo estar
em letras gregas ou romanas.
a, b, c,... , , , , ...
- Vetores
Um vetor uma seqncia de escalares que pode trazer alguma informao
interpretvel (Figura 1.1). Em voltametria, por exemplo, ao obter a corrente de pico
de medidas diferentes (amostras), pode-se dispor cada escalar (corrente de pico
individual) em uma seqncia de correntes. Ao observar esta seqncia de
escalares no vetor pode-se inferir sobre as medidas e realizar interpretaes.
Os vetores sero definidos como uma coluna de nmeros e eles sero
representados por letras minsculas em negrito.
a, b, c, ... , , , , ...

Tefilo, R. F. 6
Um vetor com I elementos ter uma dimenso (I1) com seu i-simo elemento
dado pela correspondente letra minscula itlico com um subscrito apropriado. Por
exemplo, o i-simo elemento do vetor x x
i
. O vetor 1 define uma seqncia de
nmeros, todos eles iguais a 1.
- Matrizes
Uma matriz uma seqncia de vetores, todos eles com a mesma dimenso e
organizados em uma tabela (Figura 1.1). Um voltamograma, por exemplo,
formado por uma seqncia de correntes obtidas com a varredura de potenciais.
Esta seqncia de correntes constitue um vetor que traz toda a informao do
voltamograma. Se mais de um voltamograma obtido nas mesmas condies e
estes voltamogramas forem dispostos seqencialmente (amostras), forma-se uma
tabela com tais voltamogramas (Tabela 1.1), onde cada ponto nesta tabela uma
corrente obtida no definido potencial. Esta tabela pode ser definida como uma
matriz de dados contendo, neste caso, informaes eletroqumicas.
Matrizes sero definidas por letras maisculas gregas ou romanas, em negrito.
,..., ... ,,C ,,,
Seus elementos sero representados pelas correspondentes letras minsculas,
em itlico com os subscritos definindo a linha e coluna, respectivamente, e.g., os
elementos da matriz X so dados por x
ij
.
Em quimiometria, os conjuntos de dados obtidos instrumentalmente so
geralmente definidos pelo smbolo X. No caso de dados de segunda ordem (i.e.
uma matriz de dados) a letra X mauscula e em negrito ser usada.
Algumas vezes, matrizes sero escritas como X(IJ) para enfatizar que a
matriz X tem I linhas e J colunas. As matrizes identidades (Apndice) de ordem J
so escritas como I
j
, mas onde a ordem bvia a partir do contexto, o subscrito
ser omitido. Frequentemente ser feito referncia s colunas da matriz, e ,
portanto conveniente definir as matrizes como uma srie de vetores colunas. Assim,
a matriz X(IJ) tambm ser definida como | |
1 2
, ,...,
J
= X x x x em que x
j
, j =
1,2,...,J so as (I1) colunas de X. Se for necessrio considerar a matriz formada
pelas primeiras S (< J) colunas de X, a matriz ser escrita como X
s
, em que
| |
1 2
( ) , ,...,
s S
I S = X x x x .

Tefilo, R. F. 7
- Tensores
Uma seqncia de matrizes de iguais dimenses organizadas de maneira a
formar, por exemplo, um cubo de dados (arranjo de altas ordens), chamado de
tensor (Figura 1.1) [3]. Os tensores sero definidos por letras maisculas, em
negrito e sublinhadas, podendo estar em letras gregas ou romanas, i.e., ,..., ,,C
.
Seus elementos sero representados como indicado para as matrizes, porm,
os subscritos estaro definindo os modos do tensor e.g., os elementos do tensor X
sero dados por x
ijk
. Algumas vezes, tensores sero escritos como X(IJK) para
enfatizar que o tensor X tem I matrizes no modo 1, J matrizes no modo 2 e K
matrizes no modo 3 (Figura 1.1).
Um tensor frequentemente considerado em termos de seu conjunto de
matrizes. Estas matrizes formam as fatias horizontal, lateral e frontal de um tensor
em trs dimenses (Figura 1.2). Especificamente, a fatia horizontal i pertence s
entidades i = 1,....,I do modo 1, a fatia lateral j pertence s entidades j = 1,....,J do
modo 2, a fatia frontal k pertence s entidades k = 1,....,K do modo 3.

Figura 1.2. Ilustrao do arranjo tensorial (trs modos) em fatias (dois modos).
Os tensores, como as matrizes, so um bloco de dados. Assim, as definies
para variveis e amostras seguem a mesma idia, porm mais de duas dimenses
so consideradas para este tipo de dado e esta nova dimenso definida como mais
uma varivel da dimenso adicional. Deste modo, as I linhas representam a
dimenso 1, das amostras (modo 1), as J colunas representam as variveis da

Tefilo, R. F. 8
dimenso 2 (modo 2) e os K tubos representam as variveis da dimenso 3 (modo
3), conforme indicado na Figura 1.3.

Figura 1.3. Definio de linhas, colunas, e tubos em um arranjo de trs dimenses.
, porm, til coletar todos os modos em uma nica matriz. O processo de
rearranjo dos elementos de X dentro de X frequentemente chamado em
quimiometria de desdobramento, mas este termo confuso, visto que em
psicometria o termo desdobramento uma tcnica particular para escalar dados
multidimensionais [4].
Aqui este processo ser denominado como matriciao de um tensor em uma
matriz e o processo reverso ser chamado de reforma de uma matriz em um tensor.
As matriciaes podem ser realizadas em todos os modos (Figura 1.4). Assim,
JKI, corresponde s entidades do modo 3 embutidas nas entidades do modo 1;
KIJ, corresponde s entidades do modo 1 embutidas nas entidades do modo 2 e
IJK, corresponde s entidades do modo 2 embutidas nas entidades do modo 3.


Tefilo, R. F. 9
Figura 1.4. Matriciao de um arranjo em trs dimenses X para um de duas dimenses
X
(IJK)
.
- Smbolos
Os sobrescritos t, + e -1 indicam transposio, pseudo-inversa e inversa,
respectivamente. As barras referem-se norma euclidiana e I simboliza uma
matriz identidade dimensionada apropriadamente. O smbolo ^ indica a matriz,
vetor ou escalar estimado. Detalhes sobre transposio, pseudo-inversa, inversa e
norma euclidiana esto descritos no apndice.
- Pr-Processamentos: Centrar na Mdia e Escalar pela
Varincia
Na maioria dos mtodos quimiomtricos que sero descritos nesta tese
assumido que as colunas das matrizes so centradas na mdia e, algumas vezes, que
elas tambm foram escaladas pela varincia da coluna. Quando estes dois pr-
processamentos so realizados simultaneamente, o que tambm comum de se
assumir; dito que as colunas da matriz esto autoescaladas pela varincia, ou
somente, que a matriz est autoescalada.
Centrar os dados na mdia equivale geometricamente, a fazer uma translao
do sistema de eixos ao longo do vetor das mdias, para o centro do conjunto de
dados.
Escalar os dados tem como objetivo colocar variveis em uma mesma escala
quando tais unidades apresentam diferentes unidades entre si ou quando a faixa de
variao dos dados grande.
Se x
ij
representa o (ij)-simo elemento da matriz X, ento a centragem dos
dados na mdia realizada da seguinte maneira
c
ij ij j
x x x = 1.1
em que
1

I
j ij i
x x I
=
=

/ a mdia aritmtica dos elementos da j-sima coluna, x


j

sendo I o nmero de elementos na coluna.
Quando as colunas de X so escaladas pela varincia temos:

Tefilo, R. F. 10
e
ij ij j
x x s = / 1.2
em que
2
1
( )
1
I
ij j
i
j
x x
s
I
=

=

, que representa o desvio padro da j-sima coluna. O


autoescalamento obtido da seguinte maneira:
( )
/
a
ij ij j j
x x x s = 1.3
Durante a tese no ser feito nenhuma distino de notao entre a matriz X
original e a pr-processada por centragem ou por autoescalamento.
- Transformao: Correo de Linha de Base
Durante a obteno dos dados, variaes sistemticas podem ocorrer e devem
ser removidas ou corrigidas antes das anlises [5,6].
Em anlises eletroqumicas, muitas variveis podem influenciar o sinal, o que
pode comprometer a qualidade dos resultados. Podemos destacar como influncias,
o deslocando da linha de base para maiores ou menores valores de corrente;
deformaes do sinal, salincias indesejveis na parte ngreme do sinal, ou um sinal
obtido sobre uma corrente de fundo inclinada.
Uma maneira de resolver parte destes problemas atravs da subtrao do
branco da respectiva amostra. Entretanto, algumas salincias podem ainda
permanecer e o deslocamento na linha de base no completamente corrigido.
Alm disso, nem sempre possvel obter um sinal de branco para cada amostra.
Uma maneira prtica e eficiente de resolver estes tipos de problemas
aplicando a correo de linha de base para cada amostra usando uma mdia mvel.
Durante a aplicao deste mtodo o nmero de pontos nos dados (nmero de
variveis J) substitudo temporariamente pelo clculo da mdia dentro de uma
janela de potenciais. A abertura da janela deve ser definida como tendo a menor
largura do pico do voltamograma obtido. A linha de base subsequentemente
calculada comparando cada valor de corrente com o valor mdio de seus dois
vizinhos. Se o valor absoluto da mdia for menor, a corrente substituda pelo
valor atual da mdia. Esta operao realizada repetidas vezes at que nenhum

Tefilo, R. F. 11
valor de corrente seja mais substitudo. Depois que a correo da linha de base
realizada com sucesso, um sinal com um pico bem definido obtido [7].
importante ressaltar que ao final do processo o nmero de variveis originais no
alterado.
Planejamento e Anlise de Experimentos
Um experimento apenas um teste de uma srie de testes. Experimentos so
executados em todas as disciplinas cientficas e so uma importante parte do nosso
aprendizado sobre o funcionamento dos sistemas e processos. A validade das
concluses que so inferidas de um experimento depende da escala em que o
experimento foi conduzido. Portanto, o planejamento de experimentos representa
um dos principais papis na eventual soluo do problema que inicialmente
motivou o experimento [8].
Os experimentos podem ser executados em duas ou mais variveis (ou fatores)
que o experimentalista supe serem importantes, como por exemplo, pH e tipo de
enzima. Os planejamentos fatoriais uma poderosa ferramenta para investigar este
tipo de problema. Geralmente, em um planejamento experimental, os ensaios so
executados em todas as combinaes dos nveis dos fatores, normalmente dois ou
trs.
Por outro lado, a metodologia de superfcie de resposta (RSM) uma coleo
de tcnicas matemticas e estatsticas que so teis para modelar e analisar sistemas
onde a resposta de interesse influenciada por vrias variveis, e cujo objetivo
otimizar a resposta. Neste caso, em relao aos planejamentos fatoriais, mais nveis
das variveis so investigados em uma maior regio experimental.
Para analisar os resultados de ambas as metodologias, vrios grficos e tabelas
so utilizadas. O mtodo de regresso por quadrados mnimos extremamente
necessrio e normalmente, o primeiro clculo realizado. A anlise de varincia
(ANOVA), em particular, usada como uma das principais ferramentas para a
anlise estatstica.
Nesta seo sero descritos os planejamentos fatoriais completos e
fracionrios, normalmente empregados na etapa de triagem. Para a etapa de

Tefilo, R. F. 12
otimizao sero descritos os planejamentos compostos centrais e Doehlert, que se
baseiam na metodologia de superfcie de resposta.
- Experimentos para Triagem
Muitas vezes em um sistema, diversos fatores ou variveis (os termos fatores e
variveis sero usados nesta seo indistintamente) podem influenciar a resposta
desejada. Um experimento para triagem executado com o interesse em se
determinar as variveis experimentais e as interaes entre variveis que tm
influncia significativa sobre as diferentes respostas de interesse [8,9].
Aps selecionar as variveis que so possveis de serem estudadas e que
provavelmente interferem no sistema, preciso avaliar a metodologia experimental
(tempo, custo, etc.). As variveis que no forem selecionadas devem ser fixadas
durante todo o experimento.
Em uma etapa seguinte, deve-se escolher qual planejamento usar para estimar
a influncia (o efeito) das diferentes variveis no resultado. No estudo de triagem,
as interaes entre as variveis (interaes principais) e de segunda ordem, obtidas
normalmente pelos planejamentos fatoriais completos ou fracionrios, so de
extrema importncia para a compreenso do comportamento do sistema.
- Planejamentos Fatoriais Completos
Em um planejamento fatorial so investigadas as influncias de todas as
variveis experimentais de interesse e os efeitos de interao (sinergismo) entre
elas na resposta ou respostas. Se a combinao de J fatores investigada em dois
nveis, um planejamento fatorial consistir de 2
J
experimentos. Normalmente, os
nveis dos fatores quantitativos (i.e. concentraes de uma substncia, valores de
pH, etc.) so designados pelos sinais (menos) para o nvel mais baixo e + (mais)
para o nvel mais alto, porm o que importa a relao inicial entre o sinal
atribudo e o efeito obtido, no sendo um critrio definido a nomeao dos sinais.
Para fatores qualitativos (i.e. tipos de cidos, tipos de catalisadores, etc.), como no
existem valores altos ou baixos, fica a critrio do experimentalista atribuir os seus
nveis.

Tefilo, R. F. 13
Os sinais para os efeitos de interao de 2 ordem e de ordem superior entre
todas as variveis do planejamento, realizando todas as combinaes possveis, so
obtidos pelo produto dos sinais originais das variveis envolvidas. Desta maneira
possvel construir as colunas de sinais para todas as interaes e assim elaborar a
matriz de coeficientes de contraste (Tabela 1.2).
Tabela 1.2. Matriz de coeficientes de contraste para um planejamento fatorial 2
3
.
Variveis Interaes*
Mdia x
1
x
2
x
3
x
12
x
13
x
23
x
123

+ - - - + + + -
+ + - - - - + +
+ - + - - + - +
+ + + - + - - -
+ - - + + - - +
+ + - + - + - -
+ - + + - - + -
+ + + + + + + +
* x
12
, x
13
e x
23
, so os efeitos de interao de 2 ordem; x
123
o efeito de interao de 3
ordem.
Uma coluna de sinais + (mais) adicionada esquerda da matriz de
coeficientes de contraste para o clculo da mdia de todas as respostas observadas.
Suponha um planejamento fatorial com I ensaios e com
i
y observaes
individuais (quando houver replicatas, considere a resposta mdia
i
y ). Os efeitos
para cada coluna da matriz de coeficientes de contraste (conforme Tabela 1.2) so
dados pelas seguintes equaes:
1
I
i
i
mdio
y
ef
I
=
=

1.4
1 1
2

I I
i i
i i
I
y y
ef
+
= =

=

2 2
( ) ( )
1.5
A equao 1.4 descreve o efeito para a mdia de todas as observaes,
enquanto a equao 1.5 descreve a diferena entre as mdias das observaes no
nvel mais (
i
y
+ ( )
) e as mdias das observaes no nvel menos (
i
y
( )
).

Tefilo, R. F. 14
Outro mtodo para o clculo dos efeitos para um planejamento fatorial
completo ser descrito mais adiante no item: Modelos Empricos em Estudo de
Triagem.
- Planejamentos Fatoriais Fracionrios
O planejamento fatorial completo necessita de 2
J
ensaios para sua execuo,
portanto sua principal desvantagem o grande nmero de ensaios que devem ser
realizados a cada fator adicionado ao estudo. Se considerarmos (e observarmos)
que os efeitos de altas ordens, principalmente para planejamentos com J > 4, so
quase sempre no significativos, a realizao de ensaios para estimar tais efeitos de
interao desnecessria. Desta maneira, com um nmero menor de experimentos,
possvel obter informaes daqueles efeitos mais importantes e retirar, na maioria
das vezes, as mesmas concluses caso fosse realizado um planejamento fatorial
completo. Os planejamentos que apresentam estas caractersticas so conhecidos
como planejamentos fatoriais fracionrios [9-13].
H muitos e diferentes tipos de planejamentos fatoriais fracionrios (1/2, 1/4,
1/8, 1/16...1/2
b
de um planejamento 2
J-b
) descritos na literatura [9-11], em que J o
nmero de variveis investigadas e b o tamanho da frao. O tamanho da frao
influenciar no possvel nmero de efeitos a serem estimados, e consequentemente,
no nmero de experimentos necessrios [9].
Pode-se ainda dizer que h dois tipos de fraes: aquelas cujo objetivo obter
somente os efeitos principais [12] e aquelas em que se adicionam experimentos
para separar e estimar efeitos de interaes, caso se assuma que tais interaes
apresentam influncia sobre os resultados [9]. No primeiro caso necessrio
executar, por exemplo, apenas 8 experimentos para investigar 7 variveis, 12
experimentos para 11 variveis, etc. Estes so conhecidos como planejamentos
saturados [9-11] e planejamentos de Plackett-Burman [12].
- Construo do planejamento fatorial fracionrio
Normalmente, para a construo do planejamento fatorial fracionrio
desejado, utiliza-se um planejamento fatorial completo. Para exemplificar,
consideremos um planejamento 2
3-1
construdo a partir de um planejamento fatorial

Tefilo, R. F. 15
completo com duas variveis: V
1
e V
2
. A Tabela 1.3 apresenta o planejamento
fatorial completo com duas variveis. Sero necessrios quatro experimentos para a
execuo deste planejamento 2
2
e a partir dos resultados podem-se obter os efeitos
principais das duas variveis e o efeito de interao (V
1
.
V
2
). A coluna da matriz de
coeficientes de contraste responsvel pela interao obtida pela multiplicao dos
elementos da coluna da varivel V
1
com os respectivos elementos da varivel V
2
.
As colunas de V
1
, V
2
e V
1
V
2
da matriz de coeficientes de contraste de um
planejamento fatorial completo definem a configurao de um planejamento
fatorial fracionrio com trs variveis utilizando apenas os quatro ensaios
destacados em negrito na Tabela 1.4, em que V
1
, V
2
e V
1
V
2
sero substitudas pelas
variveis independentes x
1
, x
2
e x
3
.
Como o nmero de experimentos a metade do completo, temos uma meia
frao de um planejamento fatorial 2
3
(
3 1 3 3 1
1
2
2 2 2 2

= = ), conforme as Tabelas 1.3
e 1.4.


Tabela 1.3. Planejamento fatorial fracionrio 2
3-1
a partir de um planejamento fatorial
completo 2
2
.
Nexp.
(*)
x
1
(V
1
) x
2
(V
2
) x
3
(V
1
V
2
)
5 -1 -1 1
2 1 -1 -1
3 -1 1 -1
8 1 1 1
(*)
Ensaios correspondentes obtidos da Tabela 1.3.
Uma outra propriedade importante dos planejamentos fatoriais fracionrios diz
respeito aos experimentos selecionados que cobrem o volume mximo do domnio
considerado em um nmero limitado de experimentos [9]. Note nas Tabelas 1.2 e
1.3 que os experimentos destacados so comuns aos dois planejamentos.
A Figura 1.5 destaca como os experimentos de meia frao selecionados se
distribuem em um domnio experimental para trs variveis (Tabela 1.4).
Tabela 1.4. Planejamento fatorial completo 2
3
.
N exp. x
1
x
2
x
3


Tefilo, R. F. 16
1 -1 -1 -1
2 1 -1 -1
3 -1 1 -1
4 1 1 -1
5 -1 -1 1
6 1 -1 1
7 -1 1 1
8 1 1 1

Figura 1.5. Experimentos selecionados para um planejamento fatorial fracionrio
2
3-1
.
Para a montagem de um planejamento fatorial fracionrio saturado, considere
o seguinte exemplo: sete variveis podem ser estudadas, com um mnimo de
experimentos, em um planejamento fatorial fracionrio com frao 1/16, ou seja,
2
7-4
( )
7 4 7 7 4
1
16
2 2 2 2

= = . Para este caso, o planejamento definido pelo modelo de
matriz para um planejamento fatorial 2
3
(Tabela 1.4).
Um planejamento fatorial completo com sete variveis necessita de 128
experimentos. Sendo o planejamento fracionrio 2
7-4
, 1/16 do planejamento
completo, ele necessitar de somente 8 experimentos.
Neste caso, para a elaborao da matriz de planejamento a partir da matriz
mostrada na Tabela 1.4, as variveis x
4
, x
5
, x
6
e x
7
, sero os produtos das colunas
das variveis x
1
x
2
, x
1
x
3
, x
2
x
3
e x
1
x
2
x
3
, respectivamente.

Tefilo, R. F. 17
- Efeitos confundidos e resoluo
Certamente h perda de informaes quando se realizar um planejamento
fatorial fracionrio. Os efeitos principais so misturados com os efeitos de
interao e esta contaminao aumenta entre as interaes quando se aumenta a
frao do planejamento.
Para entender melhor a confuso causada por esta mistura, considere uma
meia frao de um planejamento fatorial 2
5-1
(Tabela 1.5). O objetivo obter todos
os efeitos principais e todos os possveis efeitos de interao realizando apenas 16
ensaios. Uma matriz de planejamento elaborada a partir de um planejamento 2
4
.
A coluna da quinta varivel (5) obtida a partir da multiplicao de todas as outras,
ou seja, 1234. Assim 5 = 1234, chamado de gerador de um planejamento
fracionrio [11] [13]. Observa-se pela Tabela 1.5 que os coeficientes de contraste
para o efeito de 123 tm os mesmos sinais de 45. Isto mostra que os efeitos
estimados por estas duas interaes sero os mesmos, ou seja, sero confundidos,
sendo assim chamados de pseudnimo um do outro.
A meia frao do planejamento mostrada na Tabela 1.5 foi obtida a partir do
gerador (5=1234), no entanto, para conhecer a identidade de um pseudnimo
realizada uma definio de contrastes a partir da relao apresentada pela equao
1.6.
C = 12345 1.6
O pseudnimo obtido multiplicando o definido contraste C por cada um dos
efeitos. Por exemplo: o pseudnimo de 1 obtido multiplicando 1 por 12345.
Considere tambm, como regra, que se um mesmo termo aparecer mais de uma vez
na multiplicao, este termo desaparece. Portanto, 112345 = 2345. Para 12 o
pseudnimo 1212345 = 345.
Tabela 1.5. Coeficientes de contraste para um planejamento fatorial fracionrio 2
5-1
.
N exp. 1 2 3 4 5 1234 123 45 2345
1 - - - - + + - - -
2 + - - - - - + + +
3 - + - - - - + + -
4 + + - - + + - - +
5 - - + - - - + + -

Tefilo, R. F. 18
6 + - + - + + - - +
7 - + + - + + - - -
8 + + + - - - + + +
9 - - - + - - - - +
10 + - - + + + + + +
11 - + - + + + + + -
12 + + - + - - - - +
13 - - + + + + + + -
14 + - + + - - - - +
15 - + + + - - - - -
16 + + + + + + + + +

Se outro fator F adicionado ao planejamento 2
5-1
(Tabela 1.5) ele passa a ser
um planejamento 2
5-2
e, portanto, um quarto do fatorial completo. Para obter este
novo fator, uma outra definio de contrastes obtida de um gerador adicional.
Assim 5 = 1234 e 6 = 123. Portanto, C = 12345 e C = 1236, respectivamente. Uma
terceira definio de contrastes ento obtida multiplicando os dois anteriores
conforme a equao 1.7.
C = 123451236 = 456 1.7
O pseudnimo para cada efeito pode agora ser obtido pela maneira usual. Para
1 temos: 1 = 112345 = 11236 = 1456 ou 1 = 2345 = 236 = 1456.
Assim, com um quarto do planejamento 2
5
, cada efeito apresenta trs
pseudnimos e a estimativa dos efeitos principais so individuais, no entanto eles
se confundem com efeitos de interao de 2 ordem.
Este tipo de confuso pode ocasionalmente causar dificuldades na
interpretao dos resultados, mas isto facilmente contornado por adio de
poucos experimentos complementares a fim de separar efeitos confundidos.
Um importante conceito em planejamentos fatoriais fracionrios a resoluo
do planejamento, que define a ordem em que se negligenciam os efeitos e
definida por um nmero romano colocado depois do planejamento ou subescrito.
Em geral, a resoluo o valor do nmero de fatores que compem o termo de
menor comprimento nas definies de contrastes C [11]. Para ilustrar:
Resoluo III No confunde efeitos principais entre si, mas os confunde com
efeitos de interao entre dois fatores.

Tefilo, R. F. 19
Resoluo IV No confunde efeitos principais entre si e nem com efeitos de
interao entre dois fatores, mas confunde efeitos principais com efeitos de
interao entre trs variveis e os efeitos entre duas variveis se confundem com
outros efeitos, inclusive entre eles.
Resoluo V Os efeitos principais so confundidos com efeitos de interao
entre quatro variveis e os efeitos de interao entre duas variveis so confundidos
com efeitos de interao entre trs variveis.
Planejamentos fatoriais fracionrios com resoluo maior que V so raramente
usados em triagem [9].
Os clculos para estimativa dos efeitos para um planejamento fatorial
fracionrio sero descritos mais adiante no item: Modelos Empricos em Estudo de
Triagem.
- Planejamentos Fatoriais com Ponto Central
Em muitos casos, a realizao de repeties autnticas pode ser algo
inconveniente por diversas razes. Para contornar este infortnio e obter uma boa
estimativa dos erros, um experimento normalmente includo no centro do
planejamento (Figura 1.6), em que o valor mdio dos nveis de todas as variveis
empregado. So os conhecidos experimentos no ponto central (nvel zero). Deste
modo, possvel avaliar a significncia dos efeitos ou coeficientes, tanto em
planejamentos de triagem (completos ou fracionrios) como em metodologias de
superfcie de resposta (discutidos mais adiante). Alm desta vantagem, recomenda-
se este tipo de experimento pelas seguintes razes [9]:
- o risco de perder a relao no linear entre os intervalos minimizado;
- possvel estimar um modelo razovel e verificar se h falta de ajuste;
Logicamente no h como fugir das repeties, mas o nmero destas, na
maioria dos casos, significativamente reduzido.
No entanto, esta metodologia somente possvel de ser aplicada quando se
utilizam variveis quantitativas, visto que, para variveis qualitativas no h como
adicionar nveis no ponto central.

Tefilo, R. F. 20
Os clculos para estimativa de efeitos e coeficientes relacionados aos
planejamentos com ponto central sero discutidos mais adiante no item: Modelos
Empricos em Estudo de Triagem.

Figura 1.6. Planejamento 2
2
com ponto central.
- Modelos Empricos em Estudo de Triagem
Pode-se assumir, desde o incio do experimento, que o sistema estudado
(domnio experimental) regido por uma expresso matemtica que funo das
variveis experimentais. Normalmente esta funo pode ser aproximada por um
polinmio, o qual pode fornecer uma boa descrio entre os fatores e a resposta
obtida. A ordem deste polinmio limitada pelo tipo de planejamento usado.
Planejamentos fatoriais de dois nveis, completos ou fracionrios, podem estimar
apenas efeitos principais e interaes. Planejamentos fatoriais de trs nveis (ponto
central) podem estimar, alm disso, o grau de curvatura na resposta.
Para descrever tais modelos em um estudo de triagem, so utilizados os
polinmios mais simples, ou seja, aqueles que contm apenas termos lineares.
Considerando um exemplo para trs variveis, x
1
, x
2
e x
3
dois polinmios seriam:
y = b
0
+ b
1
x
1
+ b
2
x
2
+ b
3
x
3
+ e 1.8
y = b
0
+ b
1
x
1
+ b
2
x
2
+ b
3
x
3
+ b
12
x
1
x
2
+ b
13
x
1
x
3
+ b
23
x
2
x
3
+ b
123
x
1
x
2
x
3
+ e 1.9
Segundo a equao 1.8, o coeficiente b
0
o valor populacional da mdia de
todas as respostas obtidas, b
1
, b
2
e b
3
so os coeficientes relacionados com as

Tefilo, R. F. 21
variveis x
1
, x
2
, e x
3
respectivamente, e o erro aleatrio associado ao modelo e,
para o caso da equao 1.9, b
12
, b
13
, b
23
so os coeficientes para as interaes x
1
x
2
,
x
1
x
3,
x
2
x
3
e b
123
o coeficiente para a interao x
1
x
2
x
3
.
A partir do planejamento montado, pode-se construir a matriz de coeficientes
de contraste, de acordo com a Tabela 1.1. A matriz de coeficientes de contraste X,
juntamente com o vetor de respostas y, obtido experimentalmente, ser utilizada
para o clculo dos coeficientes do modelo, conhecidos tambm como vetor de
regresso.
O modelo procurado, descrito pelas equaes 5 e 6 pode ser representado
matricialmente pela equao 1.10,
= Xb 1.10
em que o vetor das respostas estimadas pelo modelo e b o vetor de regresso.
Uma maneira de determinar o vetor de regresso b atravs do mtodo dos
quadrados mnimos [14] [15], definido pela equao 1.13, em que X
t
indica a
transposta de X.
b = (X
t
X)
-1
X
t
y 1.11
em que (X
t
X)
-1
a matriz inversa do produto da transposta da matriz X com ela
mesma.
Para um planejamento fatorial completo, a matriz
1
I
X quadrada e ortogonal
onde I corresponde ao nmero de ensaios. Isto ocorre pois as colunas de X no
esto normalizadas, portanto X
-1
=
1
I
X
t
. Neste caso a equao 1.13 se resume
equao 1.12.
b =
1
I
X
t
y 1.12
A equao 1.11 geral e pode ser empregada para fazer a estimativa de efeitos
e coeficientes para todos os planejamentos descritos neste artigo, no entanto a
equao 1.12 especfica para o planejamento fatorial completo, no sendo
aplicvel aos outros planejamentos descritos.

Tefilo, R. F. 22
Como as variveis so estudadas em dois nveis codificados, cada efeito
satisfaz variao de duas unidades da varivel correspondente. Se considerarmos
os fatores individualmente, pode-se provar que o valor de cada coeficiente do
modelo a metade do valor do efeito correspondente, exceto para b
0
, cujo valor o
mesmo do calculado para seu efeito (equao 1.6). Desta maneira, o modelo
empregado para descrever as respostas elaborado em funo dos efeitos por
unidade de variao individual [10].
- Estimativa dos Erros para os Efeitos atravs de Repeties
Normalmente, os resultados obtidos em experimentos de planejamento fatorial
completo ou fracionrio com repeties, consistem de uma pequena amostra de um
hipottico conjunto maior, representado por uma populao. Destes dados podemos
obter a mdia amostral, a varincia amostral e o desvio padro amostral, como se
segue:
1
R
r
r
y
y
R
=
=

1.13
2
2
1
( )
( 1)
R
r
r
y y
s
R
=

=

1.14
2
1
( )
( 1)
R
r
r
y y
s
R
=

=

1.15
em que R o nmero de replicatas, isto , o nmero de ensaios realizados em um
mesmo ponto experimental (nvel), y
r
so os valores de cada observao individual,
y o valor mdio, s
2
a varincia e s o desvio padro.
A soma dos desvios da mdia amostral de R replicatas necessariamente zero.
Isto requer que ( ) 0
r
y y =

constitua uma restrio linear nos desvios usados no


clculo de s
2
. Est subentendido que com R 1 replicatas possvel determinar a
que falta. Os R resduos y y e consequentemente a soma dos seus quadrados
juntamente com a varincia amostral, so ditas ter, por esta razo, R 1 graus de

Tefilo, R. F. 23
liberdade. A perda de um grau de liberdade est associada necessidade de
substituir a mdia populacional pela mdia amostral derivada dos dados. Desta
maneira, quando repeties genunas so realizadas em uma srie de condies
experimentais, a variao entre suas observaes pode ser usada para estimar o
desvio padro de uma simples observao e consequentemente o desvio dos efeitos
[11]. Todos os ensaios, inclusive repeties, devem ser realizados aleatoriamente,
refazendo todas as etapas do experimento. As repeties realizadas desta maneira
so consideradas genunas.
Em um experimento em que cada ensaio foi realizado r vezes, se o valor de R
for pequeno, por exemplo, 2 R 10, haver poucos graus de liberdade para o
clculo da varincia. Uma maneira para se obter um maior nmero de graus de
liberdade realizando uma estimativa conjunta das varincias conforme a equao
1.16.
2
2
1
1
[( 1) ]
( 1)
I
i i
i
c I
i
i
R s
s
R
=
=

1.16
1
( 1)
I
i
i
R v
=
=

1.17
O resultado da equao 1.16 reflete a varincia conjunta (
2
c
s ) de cada
observao individual y
i
sendo o erro padro igual raiz quadrada do mesmo. A
equao 1.17, que exatamente o denominador da equao 1.16 , portanto, o
nmero de graus de liberdade da estimativa conjunta, designada comov .
Observa-se atravs das equaes 1 e 2 e considerando a realizao de
repeties autnticas, que cada efeito uma combinao linear dos valores de y
i

dos I ensaios, com coeficientes c iguais a + 2/I e -2/I. Levando em considerao a
aleatoriedade dos ensaios, tais valores so estatisticamente independentes e
apresentam a mesma varincia populacional
2
. Neste caso, por definio, as
correlaes entre todas as variveis so nulas, e a varincia da combinao linear
das variveis aleatrias pode ser dada por [10]:
2 2 2
i i
i
c o o =

1.18

Tefilo, R. F. 24
Transportando a equao 1.18 para o nosso mundo amostral, pode-se provar
que a varincia de cada efeito dada por [10]:
2
1
4
( )
c
I
i
i
s
V ef
R
=
=

1.19
em que
2
c
s dada pela equao 1.16.
Finalmente, para calcular o valor do erro padro de cada efeito, basta extrair a
raiz quadrada de V(ef).
- Estimativa dos Erros para os Efeitos, sem Repeties
Uma maneira de estimar erros de efeitos sem a realizao de repeties
supor que interaes de altas ordens para J> 3 no so significativos e, portanto, so
erros experimentais nos valores dos efeitos.
Aplicando a equao 1.16 sobre estes efeitos de interao e fazendo algumas
consideraes, obtm-se a varincia dos efeitos conforme a equao 1.20.
1
( )
V( )
l
i
i
efi
ef
l
=
=

2
1.20
em que efi
i
so os efeitos de interao considerados como erros experimentais e l
o nmero total de efeitos considerados.
preciso estar atento ao utilizar este tipo de estimativa do erro. Nem sempre
os efeitos de altas ordens so irrelevantes e, se tais efeitos forem includos no
clculo, os erros se tornam altos e desta maneira no possvel distinguir com
confiabilidade aqueles que so realmente importantes.
O nmero de graus de liberdade utilizado para a avaliao dos efeitos
agregados a estes erros o mesmo nmero total de efeitos considerados como
erros, isto , o valor l da equao 1.20.

Tefilo, R. F. 25
- Estimativa dos Erros para os Efeitos e Coeficientes a partir das
Repeties no Ponto Central
Conforme mencionado anteriormente, uma das grandes vantagens da incluso
de experimentos no centro do planejamento devido a estimativa do erro com
poucas repeties, normalmente entre 3 e 5.
A partir das repeties realizadas possvel obter a mdia e a varincia das
replicatas de acordo com as equaes 1.13 e 1.14, respectivamente.
Por outro lado, sendo os coeficientes obtidos atravs da equao 1.11, nota-se
que a matriz (X
t
X)
-1
apresenta grande influncia na varincia dos parmetros de
regresso. O produto desta matriz com o valor da varincia obtida atravs das
repeties no ponto central (equao 1.14) fornece a matriz V(b) conhecida como
matriz de varincia-covarincia (equao 1.21). A matriz V(b) simtrica e os
elementos de sua diagonal so as varincias dos parmetros de regresso na mesma
ordem em que elas aparecem na equao de regresso. Os elementos fora da
diagonal so as covarincias entre os parmetros de regresso. A raiz quadrada dos
elementos da diagonal principal da matriz V(b) determina os valores
correspondentes dos erros padro (s
bi
) dos coeficientes calculados (equao 1.22).


V(b) = (X
t
X)
-1
s
2
1.21
s
bi
=
ii
( ) v b , i=1, 2, ..., I 1.22
- I dentificao dos Efeitos e Coeficientes Significativos
Na literatura [9-11,13] h diferentes mtodos para se avaliar efeitos e
coeficientes significativos; entre os mais usados destaca-se a anlise de varincia
(ANOVA), o grfico de probabilidade (distribuio normal), e a comparao de
efeitos com uma medida independente da variabilidade. Neste trabalho, as
avaliaes de significncia para a deciso estatstica, tanto para efeitos como para
coeficientes de modelos, foram realizadas empregando o teste t (distribuio de
Student), atravs do valor p [8,16].

Tefilo, R. F. 26
Para realizar a interpretao correta utilizando o valor p necessrio
compreender os testes de hiptese e significncia, conforme descrito abaixo.
Em muitos casos, formula-se uma hiptese estatstica com o propsito de
rejeit-la ou invalid-la. Por exemplo: se o desejo decidir se um sistema
diferente do que outro, formula-se a hiptese de que no h diferena entre os
sistemas. Essa hiptese denominada nula e representada por H
0
. Qualquer
hiptese diferente da pr-fixada denominada hiptese alternativa e normalmente
representada por H
1
[8,16].
Se uma hiptese for rejeitada quando deveria ser aceita, diz-se que foi
cometido um erro tipo I. Se, por outro lado, uma hiptese for aceita quando deveria
ter sido rejeitada, diz-se que foi cometido um erro do tipo II. Em ambos os casos
foi tomada uma deciso errada ou foi cometido um erro de julgamento [8].
Para que qualquer teste de hiptese ou regra de deciso seja adequada, eles
devem ser planejados de modo que os erros de deciso sejam reduzidos ao mnimo.
Ao testar uma hiptese estabelecida, a probabilidade mxima, representada
freqentemente por , com a qual se sujeitaria a correr o risco de um erro do tipo I
denominada nvel de significncia do teste.
Se, por exemplo, escolhido um nvel de significncia = 0,05 ou 5%, h
ento cerca de 5 chances em 100 da hiptese nula ser rejeitada, quando deveria ser
aceita, isto , h uma confiana de 95% de que se tomou uma deciso correta.
Nesses casos, diz-se que a hiptese rejeitada ao nvel de significncia 0,05, o que
significa que a probabilidade de erro seria de 0,05 [16].
Considerando a hiptese nula de que o valor do efeito se confunde com seu
erro, pode-se formular a seguinte regra de deciso:
a) Rejeio da hiptese nula com 5% de significncia, quando o valor de
t
calc
situar-se fora do intervalo entre t

(
calc
t t
o
> ). Isso equivale a dizer que o
valor estatstico amostral observado significativo no nvel definido.
b) Aceitao da hiptese, caso contrrio.
Uma maneira alternativa de concluir o teste de hiptese comparar o valor p
do teste estatstico amostral com o nvel de significncia . O valor p do teste
estatstico amostral o menor nvel de significncia para que se rejeite H
0
[8].
Neste sentido, compara-se o valor p com e, se o valor p rejeita-se H
0
, caso

Tefilo, R. F. 27
contrrio H
0
aceito. A vantagem de se conhecer o valor p est na possibilidade de
se avaliar todos os nveis de significncia para que o resultado observado possa ser
estatisticamente rejeitado [8,16]. A representao grfica do valor p descrita na
Figura 1.7.

Figura 1.7. Representao grfica do valor p para um teste unilateral.
Conforme as Figuras 1.7(a e b), o nvel de significncia a rea hachurada
no grfico de distribuio. Na Figura 1.7a a rea correspondente ao valor p maior
que o nvel de significncia, portanto, o valor calculado do teste estatstico est fora
da regio crtica, o que implica em aceitar H
0
. Para a Figura 1.7b a rea do valor p
menor que o nvel de significncia e assim, o valor calculado do teste estatstico
est dentro da regio crtica, o que implica e rejeitar H
0
. importante ressaltar que
esta discusso vlida tanto para testes unilaterais quanto para bilaterais.
Especificamente, o valor p representa a probabilidade de validade do erro
envolvido no resultado observado, isto , como representativo da populao. Por
exemplo: levando em considerao o valor de um efeito, se o valor do teste
estatstico calculado (razo entre o efeito e o seu erro) apresentar um grande desvio
da distribuio de Student, ele provavelmente descreve algo mais que o resduo
experimental. Desta maneira, ser significativo dentro de um intervalo de confiana
e assim,
o
> t t
calc
ou p , para o nmero de graus de liberdade em questo.

Tefilo, R. F. 28
- Metodologia de Superfcie de Resposta: Otimizao
Aps a realizao dos experimentos de triagem, os fatores significativos so
selecionados e uma metodologia de anlise de superfcies de respostas pode ser
executada para a otimizao do experimento. Neste sentido, otimizar significa
encontrar os valores das variveis que iro produzir a melhor resposta desejada, isto
, encontrar a regio tima na superfcie definida pelos fatores.
A metodologia de superfcie de resposta baseia-se na construo de modelos
matemticos empricos que geralmente empregam funes polinomiais lineares ou
quadrticas, para descrever o sistema estudado e, conseqentemente do condies
de explorar (modelar e deslocar) o sistema at sua otimizao.
Um planejamento experimental construdo para estimar coeficientes, segundo
algum modelo aproximado, deve reunir certos critrios desejveis, sendo os
principais [14,15]: Proporcionar boas estimativas para todos os coeficientes,
exigindo poucos experimentos; Fornecer condies de avaliao dos coeficientes e
do modelo, ou seja, da regresso e da falta de ajuste.
Neste trabalho sero descritos os Planejamentos: Composto Central (CCD -
Central Composite Design) [17] e Doehlert [18], visto que apresentam todos os
critrios descritos acima, dentre outros e possivelmente so as classes de
planejamentos mais utilizadas para ajustar modelos quadrticos (equao 1.23),


2
0
1 1

J J
j j jj j fj f j
j j f j j
y b b x b x b x x e
= = <
= + + + +

1.23
na equao 1.23, J, o nmero de variveis.
- Planejamento Composto Central
Os planejamentos compostos centrais (CCD) foram apresentados por Box e
Wilson [17] em 1951 como uma evoluo dos planejamentos 3
3
, que necessitavam
de muitos experimentos para um pequeno nmero de fatores, mesmo para
planejamentos fracionrios. Outras vantagens, como rotabilidade e blocagem

Tefilo, R. F. 29
ortogonal, alm do pouco nmero de ensaios, foram obtidas devido presena das
seguintes partes no planejamento [14]:
Um planejamento fatorial completo de dois nveis, podendo ser usado ainda,
um planejamento fatorial fracionrio de dois nveis;
Experimentos no ponto central, isto , x
i
= 0 para todo i;
Experimentos nos pontos axiais em que x
i
= , com x
j
= 0 para j i, e =
4
2
J
. Estes pontos so situados nos eixos do sistema de coordenadas com distncia
da origem e formam a parte estrela do planejamento.
A Figura 1.8 ilustra os pontos experimentais no sistema de coordenadas,
definidos pelos eixos x
i
.

Figura 1.8. Planejamentos compostos centrais: (A) J = 2 e =1.414, (B) J = 3 e
=1.682. Os diferentes smbolos significam: () planejamento fatorial, () pontos
axiais e (O) ponto central.
Para construo de um planejamento CCD necessrio definir o nmero de
variveis a serem estudadas (J), qual planejamento fatorial ser empregado
(completo 2
J
ou fracionrio 2
J-b
) e quantos experimentos sero realizados no ponto
central (normalmente, 2J+1). O nmero de experimentos a ser realizado dado por:
2
J
+2J+1. A Tabela 1.6 descreve como o valor de varia com o nmero de
variveis [14,15] e a Tabela 1.7 apresenta as matrizes de planejamento para 2 e 3
variveis.
Tabela 1.6. Alguns planejamentos CCD e suas caractersticas.
N variveis(J) 2 3 4 5 5 6 6

Tefilo, R. F. 30
Valor de b para 2
J-b
0 0 0 0 1 0 1
N de exp. no planej. fatorial 4 8 16 32 16 64 32
N de exp. no ponto axial 4 6 8 10 10 12 12
Valor de 1,414 1,682 2,000 2,378 2,000 2,828 2,378

Tabela 1.7. Matrizes dos planejamentos compostos centrais com duas e trs variveis.
Planejamento CCD 2
2
Planejamento CCD 2
3

x
1
x
2
x
1
x
2
x
3

-1 -1 Planejamento
fatorial
-1 -1 -1 Planejamento
fatorial 1 -1 1 -1 -1
-1 1 -1 1 -1
1 1 1 1 -1
-1 -1 1
0 0 Ponto central 1 -1 1
-1 1 1
- 0 Pontos axiais 1 1 1
0
0 - 0 0 0 Ponto central
0
- 0 0 Pontos axiais
0 0
0 - 0
0 0
0 0 -
0 0

Observe que neste tipo de planejamento, os nveis (o mesmo vale para
qualquer valor codificado x
i
) necessitam ser decodificados para os valores
experimentais dos nveis das variveis a serem estudadas e para isso utiliza-se a
equao 1.24:
2
i
i
z z
x
z

=
A
1.24
em que x
i
o valor codificado do planejamento CCD, z
i
o valor experimental do
nvel, z o valor mdio entre os nveis mais (+) e menos (-), que exatamente o
valor do nvel zero (0) e z A a diferena entre os nveis mais (+) e menos (-).

Tefilo, R. F. 31
Vale ressaltar tambm, que aceitvel o ajuste de a um valor
experimentalmente vivel para o nvel, desde que no ocorram grandes distores
no valor original.
Utilizando a Tabela 1.6 podem-se construir diferentes tipos de planejamentos
CCD, conforme aqueles apresentados na Tabela 1.7. A partir do planejamento
montado, pode-se obter a matriz de coeficientes de contraste, de acordo com a
Tabela 1.2. O modelo apresentado na equao 1.23 pode ser representado
matricialmente segundo a equao 1.10 e seus coeficientes so estimados atravs
da equao 1.11.
A estimativa dos erros para os coeficientes a partir das replicatas no ponto
central realizada conforme as equaes 1.21 e 1.22 e a avaliao dos coeficientes
realizada conforme o item: Identificao dos Efeitos e Coeficientes
Significativos, descrito anteriormente.
- Matriz Doehlert
O planejamento Doehlert ou Matriz Doehlert foi apresentado por David H.
Doehlert em 1970 [18], sendo uma alternativa bastante til e atrativa aos
planejamentos experimentais de segunda ordem. Os pontos da matriz Doehlert
correspondem aos vrtices de um hexgono gerado de um simplex regular e em
geral, o nmero total de pontos experimentais no planejamento igual a J
2
+J+pc,
em que J o nmero de fatores e pc o nmero experimentos no ponto central.
Uma importante propriedade do planejamento Doehlert diz respeito ao nmero de
nveis que cada varivel possui. Com quatro variveis, por exemplo, o nmero de
nveis so 5, 7, 7 e 3, o que permite avaliar as variveis consideradas mais
importantes, ou seja, que apresentam efeitos mais pronunciados em um nmero
maior de pontos do espao estudado [19]. Alm disso, este tipo de planejamento
necessita de um menor nmero de experimentos em relao ao planejamento
Composto Central, sendo, portanto, mais eficiente. Esse menor nmero de
experimentos para se chegar regio tima vem do fato de que o domnio da
vizinhana facilmente explorado pelo ajuste de poucos experimentos, j que o
prximo hexgono utiliza pontos experimentais j explorados pelo hexgono
anterior, conforme Figura 1.9 [9].

Tefilo, R. F. 32

Figura 1.9. Planejamento Doehlert com duas variveis () com adio de novos
experimentos ().
O planejamento Doehlert descreve um domnio circular para duas variveis,
esfrico para trs e hiperesfrico para mais de trs variveis, o que acentua a
uniformidade no espao envolvido. Embora suas matrizes no sejam ortogonais
nem rotacionais, elas no apresentam divergncias significativas que comprometa a
qualidade necessria para seu uso efetivo [20]. Para duas variveis, a matriz
Doehlert consiste de um ponto central e mais seis pontos adicionais formando um
hexgono regular e, por esse motivo, situada sob um crculo (Figura 1.9). As
matrizes do planejamento Doehlert para duas, trs e quatro variveis podem ser
visualizadas na Tabela 1.8. As matrizes Doehlert apresentadas na Tabela 1.8 so
pr-estabelecidas e suas construes no so triviais como os outros planejamentos
apresentados neste trabalho. Mais detalhes sobre a construo deste tipo de matriz
podem ser obtidos nas referncias 22 e 25.
Cada planejamento definido considerando o nmero de variveis e os
valores codificados (x
i
) da matriz experimental. A relao entre os valores
experimentais e os valores codificados dada pela Equao 1.25.
0
i i
i d
i
z z
x
z
|
| |
=
|
A
\ .
1.25
O termo x
i
o valor codificado para o nvel do fator i; z
i
o seu experimental;
z
i
a distncia entre o valor experimental no ponto central e o experimental no

Tefilo, R. F. 33
nvel superior ou inferior,
d
o maior valor limite codificado na matriz para cada
fator e
0
i
z o valor experimental no ponto central.
Tabela 1.8. Matrizes Doehlert para duas, trs e quatro variveis.
Variveis Experimentais Matriz Doehlert
2 Variveis 3 Variveis 4 Variveis
x
1a
x
2a
x
1b
x
2b
x
3b
x
1c
x
2c
x
3c
x
4c

1 0 0 0 0 0 0 0 0 0
2 1 0 1 0 0 1 0 0 0
3 0,5 0,866 0,5 0,866 0 0,5 0,866 0 0
4 -1 0 0,5 0,289 0,817 0,5 0,289 0,817 0
5 -0,5 -0,866 -1 0 0 0,5 0,289 0,204 0,791
6 0,5 -0,866 -0,5 -
0,866
0 -1 0 0 0
7 -0,5 0,866 -0,5 -
0,289
-
0,817
-0,5 -0,866 0 0
8 0,5 -
0,866
0 -0,5 -0,289 -
0,817
0
9 0,5 -
0,289
-
0,817
-0,5 -0,289 -
0,204
-
0,791 10 -0,5 0,866 0 0,5 -0,866 0 0
11 0 0,577 -
0,817
0,5 -0,289 -
0,817
0
12 -0,5 0,289 0,817 0,5 -0,289 -
0,204
-
0,791 13 0 -
0,577
0,817 -0,5 0,866 0 0
14 0 0,577 -
0,817
0
15 0 0,577 -
0,204
-
0,791 16 -0,5 0,289 0,817 0
17 0 -0,577 0,817 0
18 0 0 0,613 -
0,791 19 -0,5 0,289 0,204 0,791
20 0 -0,577 0,204 0,791
21 0 0 -
0,613
0,791

A maioria dos pacotes computacionais disponveis atualmente, comerciais ou
gratuitos, ainda no disponibilizou algoritmos para clculos de planejamentos
Doehlert sendo, portanto, um indicativo dentre outros, de que este planejamento
est relativamente pouco difundido entre os pesquisadores.
- Avaliao do Modelo
O modelo obtido pode no ser exatamente aquele que descreve a regio
estudada do sistema e, neste caso, no pode ser usado para fazer estimativas para
deslocamento e muito menos para extrair concluses sobre a regio tima. A

Tefilo, R. F. 34
maneira mais confivel de se avaliar a qualidade do ajuste do modelo
empregando a anlise de varincia (ANOVA) [8,16].
Na ANOVA a variao total da resposta definida como a soma quadrtica de
dois componentes: a soma quadrtica da regresso (SQ
regr
) e a soma quadrtica dos
resduos (SQ
res
). A soma quadrtica da variao total, corrigida para a mdia
(SQ
total
), pode assim ser escrita como a equao 1.26.
SQ
total
= SQ
regr
+ SQ
res
1.26
em que SQ
regr
e SQ
res
so apresentadas com mais detalhes nas equaes 1.27 e 1.28,
respectivamente.
SQ
regr
= ( )
i
R M
m
m r
y y
= =

2
1 1
1.27
SQ
res
=
i
( )
R M
mr i
m m
y y
= =

2
1 1
1.28
Da equao 1.27, M o nmero total de nveis do planejamento, isto , pontos
experimentais do planejamento;
m
y o valor estimado pelo modelo para o nvel m
e y o valor mdio das replicatas (R). No entanto, como h somente replicatas no
ponto central, a mdia das replicatas nos nveis (+) mais e (-) menos o prprio
valor observado do ensaio naquele nvel. Note que o segundo somatrio indica que
se deve fazer o quadrado das diferenas inclusive com cada repetio.
As replicatas realizadas no ponto central deixaro um resduo para cada
observao
m
y . A soma quadrtica destes resduos fornece a soma quadrtica
residual somente no nvel zero.
A equao 1.28 indica que o quadrado da diferena entre o valor de cada
observao (
m
y ) e o valor estimado (
m
y ) e inclusive das replicatas (
r
y ) em cada
nvel (m), fornece a soma quadrtica residual de todos os nveis.
Quando algum modelo ajustado aos dados, a soma quadrtica do erro puro
sempre uma parte da soma quadrtica dos resduos. Ento cada resduo pode ser
desmembrado em duas partes, isto [15]:
( ) ( ) ( )
mr m mr m m m
y y y y y y = 1.29

Tefilo, R. F. 35
Pela equao 1.29, o primeiro termo da direita diz respeito diferena entre o
valor de cada observao individual no nvel e a mdia de todas as observaes
naquele nvel. J o segundo termo corresponde diferena entre o valor estimado
no nvel e a mdia de todas as observaes naquele nvel. A subtrao entre estes
dois termos fornece como resposta o resduo de cada observao individual.
Para evitar os termos negativos na equao 1.29, tomam-se as suas diferenas
quadrticas e obtm-se equao 1.30.
i
( ) ( ) ( )
i
R R M M M
mr m mr m m m
m r m r m
y y y y y y
= = = = =
= +

2 2 2
1 1 1 1 1
1.30
O primeiro termo da direita chamado de soma quadrtica do erro puro e est
relacionado exclusivamente com os erros aleatrios das replicatas. J o segundo
termo da direita chamado de soma quadrtica da falta de ajuste, pois ele uma
medida da discrepncia entre a resposta do modelo de previso (
m
y ) e a mdia das
replicatas (
m
y ) realizadas no conjunto de condies experimentais.
16

A equao 1.30 pode ser resumida da seguinte maneira:
SQ
res
= SQ
ep
+ SQ
faj
1.31
Para cada fonte de variao (regresso, resduos, falta de ajuste, erro puro e
total), necessrio obter o nmero de graus de liberdade. No introduzindo
detalhes, pode-se provar que o nmero de graus de liberdade para as equaes 1.27,
1.28 e 1.30 so, P 1, I P e (I M) + (M P), respectivamente [11,15,20], em
que P o nmero de parmetros (coeficientes) do modelo, I o nmero total de
observaes (ensaios) e M o nmero de nveis do planejamento. O nmero de
graus de liberdade para as outras fontes de variao pode ser obtido por clculos
algbricos simples.
A diviso da soma quadrtica de cada fonte de variao pelo seu respectivo
nmero de grau de liberdade fornece a mdia quadrtica (MQ). A razo entre a
mdia quadrtica da regresso (MQ
reg
) pela mdia quadrtica dos resduos (MQ
res
),
que nada mais do que a razo entre duas varincias, pode ser usada para comparar
tais fontes de variao atravs do teste F (distribuio de Fisher), levando em
considerao seus respectivos nmeros de graus de liberdade. O mesmo pode ser

Tefilo, R. F. 36
feito para a razo entre a mdia quadrtica da falta de ajuste (MQ
faj
) pela mdia
quadrtica do erro puro (MQ
ep
).
Assim, como foi realizada a avaliao dos efeitos e coeficientes empregando o
teste t, atravs do valor p, o mesmo ser feito para comparar as duas fontes de
variao entre si, empregando-se neste caso o teste F (equao 1.32).
1 2
,
F
v v
~
1
2
MQ
MQ
1.32
em que MQ
1
e MQ
2
so as mdias quadrticas das fontes de variao 1 e 2
respectivamente e,
1
,
2
so seus respectivos nmeros de graus de liberdade.
Exemplificando, a razo entre as mdias quadrticas da falta de ajuste e do
erro puro o valor calculado do teste estatstico (F
calc
), que usado para comparar
qual mais significativo. Pode-se formular uma hiptese nula (H
0
) considerando
que no h diferena entre as fontes de variao comparadas. Esta hiptese se
reflete na seguinte regra de deciso:
a) Rejeio da hiptese nula com 5% de significncia, quando o valor de
F
calc
situar-se fora do intervalo definido por F

(
calc
F F
o
> ), ou seja, p . Isso
equivale a dizer que o valor estatstico amostral observado significativo no nvel
definido e as fontes de variao comparadas so diferentes.
b) Aceitao da hiptese nula, caso contrrio.
Se H
0
for rejeitada para MQ
faj
/MQ
ep
, isto , p , ento h uma falta de ajuste
significativa ao nvel de probabilidade e nmero de graus de liberdade definidos
(normalmente, = 0,05) e o modelo no adequado.
Em termos prticos, um bom modelo necessita ter uma regresso significativa
e uma falta de ajuste no significativa. Isto equivale a dizer que a maior parte da
variao total das observaes em torno da mdia deve ser descrito pelo modelo de
regresso e o restante certamente, ficar com os resduos. Da variao que fica com
os resduos esperado que a maior parte fique com o erro puro, que o erro
experimental, e no com a falta de ajuste, que est diretamente relacionada com o
modelo.

Tefilo, R. F. 37
Outros parmetros para observar se toda variao em torno da mdia foi
explicada pela regresso so o valor do coeficiente de variao R
2
(equao 1.33) e
o grfico dos resduos [10].
O valor de R
2
representa a frao da variao em torno da mdia que
explicada pela regresso (equao 1.33). Quanto mais prximo de 1 o valor do
coeficiente estiver, melhor estar o ajuste do modelo s respostas observadas.
2
exp .
SQ
R
SQ
regr
l
total
= 1.33
Note que o erro puro no explica nada do modelo, ento o valor mximo
possvel de R
2
:
2
SQ -SQ
R
SQ
total ep
max
total
= 1.34
A anlise de varincia (ANOVA), de acordo com as equaes descritas para a
avaliao do modelo, est resumida na Tabela 1.9.
Tabela 1.9. Anlise de varincia para regresso mltipla.
Fonte de variao SQ Nde graus de liberdade MQ F
Regresso SQ
regr
P 1 MQ
regr
MQ
regr
/MQ
res

Resduos SQ
res
I P MQ
res

Falta de ajuste SQ
faj
M P MQ
faj
MQ
faj
/MQ
ep

Erro Puro SQ
ep
I M MQ
ep


Total SQ
total
I 1
Uma boa prtica examinar a distribuio dos resduos, pois ajuda a verificar
se no h nada de errado com o modelo. Neste caso, pode-se fazer um grfico dos
valores estimados pelo modelo ( )
i
y com os valores da diferena entre os valores
observados experimentalmente ( )
i
y e os seus respectivos valores estimados, isto ,
( )
i
y versus ( )
i i
y y . Se os resduos no estiverem aleatoriamente distribudos,
pode-se desconfiar do modelo e investir em outros recursos para a sua melhoria.
Anlise de Componentes Principais
A Anlise de Componentes Principais (PCA) provavelmente o mtodo
quimiomtrico mais amplamente difundido, e devido importncia das medidas

Tefilo, R. F. 38
multivariadas em qumica, ela considerada por muitos como o mtodo que mais
significativamente muda o ponto de vista dos qumicos para a anlise multivariada
dos dados [6].
A aplicao mais freqente do mtodo PCA ocorre nos casos em que as
colunas em X so altamente colineares, i.e., as variveis so correlacionadas e
apresentam redundncias. Tais colinearidades indicam que a matriz X apresenta
algum tipo de variabilidade dominante que carrega a maioria da informao
disponvel. Estas redundncias e pequenas variabilidades devem ento ser
removidas. A proposta da PCA expressar as informaes mais significativas
contidas nas variveis originais em um pequeno nmero de novas variveis, as
ento chamadas componentes principais de X [21].
Naturalmente, pode-se estender esta descrio para outros mtodos
multivariados, pois muitos diferem apenas no critrio utilizado para determinar
como as componentes so construdas [22]. Assim, a PCA constitui, em muitas
maneiras, a base para a anlise multivariada dos dados [1].
Uma variedade de algoritmos pode ser usada para calcular as componentes
principais de X. A decomposio por valores singulares (SVD) um algoritmo
rotineiramente empregado [23] e est descrito no apndice. Usando este algoritmo,
uma matriz de dimenso arbitrria pode ser escrita como produto de trs outras
matrizes, assim:
t
= X ADP 1.35
Na literatura, as matrizes A ou AD so denominadas escores e contm as
coordenadas das amostras nos eixos das componentes. Nesta tese, o produto AD
ser definido como escore e representado como a matriz T. A matriz P contm a
informao sobre como as variveis originais esto relacionadas s componentes e
denominada de matriz de loadings. A matriz D diagonal (Apndice) e contm
informaes sobre a quantidade de varincia em cada componente.
O princpio matemtico bsico da PCA est em produzir uma aproximao da
matriz de dados X, em termos do produto de duas matrizes T e P
t
conforme
Equao 1.36.
t t

h h h h h
= X= TP A D P 1.36

Tefilo, R. F. 39
em que o subscrito h representa o nmero do trucamento das matrizes i.e., quantas
componentes foram usadas para reconstruir a matriz X, definida por

X.

Figura 1.10. Representao matricial da anlise de componentes principais.
Como mostrado na Figura 1.10, na matriz T, de escores, o nmero de linhas
igual ao nmero de linhas da matriz original, usualmente o nmero de amostras. O
nmero de colunas igual ao nmero h de componentes significativos nos dados, e
pode ser qualquer nmero entre 1 e min{I,J}. O nmero de componentes
significativos comumente definido como a dimensionalidade intrnseca dos dados
ou posto qumico da matriz original.
Na matriz P
t
, de loadings, o nmero de colunas igual ao nmero de colunas
na matriz original, usualmente o nmero de variveis. O nmero de linhas
corresponde ao nmero de componentes principais h.
Geometricamente, as matrizes A e P geram um novo sistema de coordenadas
formado pelas h componentes principais (colunas de A e P), que so os novos eixos
(Figura 1.11). Assim, exatamente como as amostras tm coordenadas no espao
original das linhas (definida pelas variveis originais), elas tambm tm
coordenadas em relao aos novos eixos i.e., os escores. Estas coordenadas so as
projees ortogonais de cada amostra sobre os eixos das componentes, como
representado pelas setas retas na Figura 1.7 e descrevem a representao das
amostras padres dominantes das linhas em X.
Cada componente construda a partir da combinao das variveis originais.
Em termos matemticos, a contribuio de cada eixo original para uma componente
principal o co-seno do ngulo entre o eixo da varivel com o eixo da componente
(ngulos ' s | na Figura 1.11). Se uma componente principal aponta exatamente na
mesma direo de uma varivel individual, o ngulo entre elas zero e o co-seno

Tefilo, R. F. 40
1. Isto indica que a componente descreve toda a variao no eixo daquela varivel.
Similarmente, se uma componente perpendicular (90) ao eixo de uma
determinada varivel, o co-seno 0 indicando que esta varivel no fornece
nenhuma contribuio componente em questo. Os valores destes co-senos so os
loadings e variam na faixa de -1 a 1 [24,25].

Figura 1.11. Representao geomtrica de duas componentes principais em um espao
com trs variveis (3D).
A direo da primeira componente principal descreve o espalhamento mximo
das amostras (linhas) i.e., a quantidade mxima de variao possvel dos dados e
pode ser definida como o melhor ajuste da reta no espao multidimensional. A
prxima componente, perpendicular primeira (Figura 1.11), captura a varincia
comum em sua direo e em menor quantidade que a primeira e assim
sucessivamente. As componentes principais so, portanto, calculadas em ordem
decrescente de significncia [25,26] e a percentagem da variao total nos dados
descrita por qualquer componente pode ser calculada com preciso usando, por
exemplo, informaes da diagonal da matriz D. Porm, como as componentes so
perpendiculares entre si, elas contm informaes diferentes e complementares em
ordem decrescente de quantidade de varincia.
Devido reorientao das coordenadas do sistema de maneira a obter a
mxima varincia comum, a maioria da informao dos dados pode ser capturada

Tefilo, R. F. 41
por um pequeno nmero de componentes, que compacta as informaes,
eliminando as redundncias e correlaes nos dados originais [1,25,26]. Como
resultado, as informaes mais relevantes do ponto de vista da varincia se tornam
mais bvias, exatamente porque foram compactadas.
Um importante conceito que se pode introduzir aqui o conceito da unicidade
da anlise (ou do modelo). As componentes principais so nicas, mas no so
nicas em fornecer uma base para o plano do melhor ajuste. Este plano pode ser
tambm definido usando outra base, e.g., P pode ser rodado por Z (em que Z uma
matriz hh no singular (ver apndice). Desse modo, usando (Z
t
)
-1
para contra
rodar T, a soluo TP
t
no muda, assim:
t t 1 t t t t
( ) ( )

= = = TP T Z Z P T PZ TP , onde
P a nova base e T so os escores em relao nova base. Esta propriedade
conhecida como liberdade rotacional [27].
Calibrao Multivariada
O termo calibrao, do ponto de vista da quimiometria diretamente
relacionado construo de um modelo que relaciona respostas obtidas a partir de
determinadas amostras concentraes ou propriedades conhecidas destas
amostras. Normalmente, o principal objetivo do modelo construdo realizar
previses de concentraes ou propriedades desconhecidas a partir de respostas
obtidas a partir de novas amostras. O modelo obviamente calibrado com um
conjunto definido de amostras referncia para as concentraes ou propriedades de
interesse. As novas amostras, de onde sero obtidas as respostas previstas das
concentraes ou propriedades de interesse, normalmente apresentam as mesmas
caractersticas das amostras de referncia.
No contexto descrito acima (modelo inverso), as respostas obtidas so
normalmente definidas como variveis independentes e as concentraes ou
propriedades so definidas como variveis dependentes.
Na maioria das vezes os modelos construdos so baseados em um limitado
conhecimento do investigador em relao ao sistema, mas onde uma grande
quantidade de dados pode ser obtida. Este tipo de modelo definido como modelos
flexveis em aluso aos modelos rgidos que so aqueles derivados a partir de
teorias fundamentais do sistema investigado [22].

Tefilo, R. F. 42
Diversos so os modelos flexveis que podem ser empregados para relacionar
as respostas com as concentraes/propriedades. Atualmente, com o advento da
quimiometria, muitos modelos exigem certo tipo de arranjo das respostas para
serem construdos. Estes arranjos dependem do tipo de resposta coletada e podem
ser definidos da seguinte maneira: (1) quando uma resposta obtida para cada
amostra, a resposta um escalar e pode-se definir como arranjo de ordem zero; (2)
quando muitos escalares so obtidos para cada amostra i.e., um vetor, define-se
como arranjo de primeira ordem; (3) quando muitos vetores de mesmo
comprimento so obtidos para cada amostra i.e., uma matriz, define-se como
arranjo de segunda ordem e assim, sucessivamente [28]. A Figura 1.12 apresenta a
resposta para cada amostra e os arranjos de dados que podem ser obtidos para
construo de modelos de calibrao.
Para o arranjo de ordem zero o modelo normalmente obtido atravs de
quadrados mnimos, projetando a varivel dependente sobre a varivel
independente. Um coeficiente (escalar) faz o ajuste entre estas duas variveis. Este
procedimento conhecido como calibrao univariada e ainda, a mais usada
pelos qumicos analticos apesar deste mtodo necessitar de total seletividade da
resposta frente ao analito ou propriedade de interesse.

Tefilo, R. F. 43

Figura 1.12. Representao de vrios tipos de arranjos de dados para construo de
modelos de calibrao.
Arranjos de primeira, segunda e ordens superiores pertencem ao domnio
multivariado e so processados por adequados procedimentos quimiomtricos. A
idia central de todas estas metodologias compensar a falta de seletividade do
sinal analisado, usando eficientes e sofisticados algoritmos matemticos para
extrair a poro da massa de dados que pode ser empregada para fazer a previso
[21,26,28].
H vrias vantagens em se empregar o domnio multivariado em detrimento
do univariado, como por exemplo [29]: (1) reduo do rudo; (2) calibrao na
presena de interferentes; (3) manipulao de interferentes; (4) seleo de respostas
para aumentar a seletividade; (5) controle de amostras anmalas; (6) aspectos
exploratrio dos dados e, com algumas metodologias quimiomtricas baseadas em
dados de segunda ordem ou ordens superiores possvel: (7) realizar separao
cromatogrfica de sinais e (8) possibilidade de realizar calibrao sem a
necessidade de modelar os possveis interferentes.

Tefilo, R. F. 44
O arsenal disponvel para anlise de dados de primeira ordem pode ser
dividido entre dois tipos de regresso multivariada: o clssico (ou direto) e o
inverso. A regresso multivariada clssica assume que as variveis independentes
so funo da varivel dependente e a inversa o contrrio. Destes dois tipos, a
calibrao multivariada inversa certamente a mais utilizada atualmente [1,6].
Entre as metodologias de calibrao multivariada inversa a mais simples a
regresso linear mltipla (MLR), entretanto, algumas desvantagens comprometem
a simplicidade deste mtodo e seu emprego limitado. Na MLR, a matriz de
variveis independentes X idealmente relacionada varivel dependente y pela
equao 1.10. O modelo obtido calculando o vetor de regresso b atravs de
quadrados mnimos, conforme equao 1.11.
Um problema com esta aproximao que a matriz
t
X X, quando h mais
colunas (variveis) que linhas (amostras) em X (I < J), no tem inversa. Na prtica,
devido a fatores como rudos e interferentes desconhecidos, uma inversa pode ser
calculada, mas ela no significativa, pois a soluo estar sendo influenciada por
tais fatores. O uso da inversa de
t
X X apenas praticvel se: (1) o nmero de linhas
i.e., amostras, e o nmero de colunas, i.e. variveis, so no mnimo igual ao nmero
de analitos na mistura; (2) o nmero de experimentos deve ser no mnimo igual e
de preferncia maior que o nmero de variveis (I > J) e (3) as colunas da matriz X
devem fornecer informaes nicas i.e. no pode haver colinearidade (colunas
linearmente dependentes).
Uma das maneiras de resolver o problema de colinearidade atravs do
emprego de mtodos de compresso de dados. Estes mtodos consistem em obter
poucas combinaes lineares (componentes principais) das variveis independentes
originais. Entre os mtodos de compresso que constroem novas variveis esto a
regresso por componentes principais (PCR) e a regresso PLS, sendo esta ltima a
mais usada atualmente [1,21,30].
Os mtodos de compresso de dados tais como PCR e PLS so
consideravelmente mais eficientes para lidar com rudos experimentais,
colinearidade e no caso do PLS, com leves no linearidades [21,31]. Nestes
mtodos, todas as variveis originais relevantes podem ser includas nos modelos, o
que implica que a calibrao pode ser realizada eficientemente mesmo na presena

Tefilo, R. F. 45
de interferentes se estes forem modelados [21]. Alm disso, no h necessidade do
conhecimento do nmero e natureza das variveis originais. Estes mtodos so
muitas vezes robustos, i.e., seus parmetros praticamente no se alteram com a
incluso de novas amostras no conjunto de calibrao [1,21,31]. A base
fundamental dos mtodos de compresso a anlise de componentes principais e
ser descrito com mais detalhes, para o mtodo PLS, na seo seguinte [1].
Finalmente, se para uma amostra for possvel produzir dados de segunda
ordem (matrizes) ou de ordens superiores (conjunto de matrizes), ento a estratgia
multivariada conhecida como tcnicas multimodos [3,32-34]. A descrio das
tcnicas multimodos empregadas nesta tese est descrita na ltima seo deste
captulo.
Quadrados Mnimos Parciais (PLS)
De todos os mtodos multivariados que sero discutidos nesta tese, o PLS
talvez o menos entendido [22]. Entretanto, ele amplamente usado como mtodo
de regresso multivariada e tem guiado muitos trabalhos para o esclarecimento de
suas propriedades matemtica e estatstica [35-41].
Herman Wold [42] foi o grande responsvel pelo desenvolvimento do PLS.
Isto ocorreu por volta do ano de 1975 quando ele trabalhava com dados
complicados na rea de econometria, os path models [43].
A origem do termo Partial Least Squares, que define PLS, um pouco
obscura. De acordo com Wold [42], o procedimento chamado Partial pois,
embora ele consista de muitas otimizaes locais, nenhum critrio completamente
maximizado ou minimizado. De outro modo, Lohmller [44] escreveu que o termo
Partial refere-se ao particionamento dos parmetros em subconjuntos estimveis.
Alguns dos primeiros trabalhos empregando PLS em qumica usaram
conceitos dos path models como em econometria [45,46]. Porm, o
desenvolvimento do PLS nesta rea associado em particular, ao trabalho de
Harald Martens (1985) [47], cuja tese contm muitos exemplos do uso da regresso
PLS. Os trabalhos de Frank et al. (1983) [48] e de Svante Wold (1983) [49], filho
de Herman Wold, foram tambm de grande contribuio para esta rea. Hoje as
aplicaes do mtodo PLS so vastas como, por exemplo, na indstria de

Tefilo, R. F. 46
alimentos, de produtos farmacuticos, petroqumica etc; em anlise clnica; em
estudos tericos que usam Relaes Quantitativas Estrutura-Atividade/Propriedade
(QSAR/QSPR), dentre outras. Em todas estas reas h dois pontos em comum em
relao ao conjunto de dados usados para executar o PLS: eles consistem de dois
blocos de variveis (independentes e dependentes) e dentro de cada bloco, as
variveis so frequentemente altamente correlacionadas. Na maioria dos casos em
calibrao multivariada, o bloco das variveis dependentes composto de apenas
uma coluna.
Atualmente h vrios algoritmos para executar a regresso PLS e todos eles
fornecem uma mesma previso para uma nica varivel dependente [50]. So eles:
(1) o algoritmo NIPALS (non-linear iterative partial least squares), proposto por
Wold et al. [51]; (2) o algoritmo baseado no decomposio bidiagonal (PLSBdg)
apresentado por Manne [40]; (3) o algoritmo SIMPLS, proposto por De Jong [52] e
(4) o algoritmo Kernel, proposto por Lindgren et al. [53]. Outros algoritmos esto
disponveis na literatura, mas a maioria so adaptaes ou modificaes destes
ltimos citados.
Tefilo et al. [50] realizaram uma srie de testes com estes algoritmos em
relao aos seus desempenhos computacionais e concluram que existe uma
pequena diferena entre os mtodos PLSBdg e SIMPLS, mas ambos foram
extremamente mais eficientes que os outros dois, principalmente para grandes
conjuntos de dados. O algoritmo Kernel mostrou ser extremamente dispendioso
computacionalmente.
Apesar de no ter um alto desempenho computacional, o algoritmo NIPALS
hoje o mais conhecido e talvez o mais amplamente usado, porm, os algoritmos
SIMPLS e principalmente o PLSBdg tendem a se tornar os mais empregados no
futuro.
Nesta tese, a discusso ser realizada sobre os algoritmos NIPALS e PLSBdg.
Na discusso, ser assumido que as matrizes X (I x J) e y(I x 1) foram centradas na
mdia e que elas so as variveis independentes e dependentes, respectivamente.
Alm disso, para evitar confuso, os termos variveis latentes e fatores sero
substitudos por componentes principais. Deste modo, min(I 1, J) componentes

Tefilo, R. F. 47
podem ser extradas. Entretanto, em aplicaes reais, poucas destas componentes
so extradas.
Embora no algoritmo NIPALS os passos individuais sejam muito simples, no
imediatamente bvio justificar o que est sendo otimizado ou o que exatamente
est ocorrendo. Muitos esforos tm sido feito para explicar como o algoritmo
funciona; em particular os trabalhos de Naes e Martens (1985) [54], Manne (1987)
[40], Lorber et al. (1987) [55], Helland (1988) [56], Phatak (1993) [22] e mais
recentemente Ergon [57] e Pell et al. [58] tentam esclarecer a confuso e colocar o
PLS dentro de uma base matemtica e estatstica firme e consolidada.
Os detalhes do algoritmo NIPALS (verso ortogonal) podem ser descritos
como segue [22]:
1.
t t t

h
= w X y / y XX y , clculo do vetor de pesos normalizado para h=1;
2.

h h
= t Xw , clculo do vetor de escores ortogonais usando os pesos;
3.
t t

/
h h h h
= p X t t t , clculo do vetor de loading normalizado;
4.
t

h h
=
X
E X t p , clculo dos resduos da matriz X;
5. Incremente h, substitua X por E
X
na etapa 1 e continue at atingir o nmero
desejado de componentes.
6.
t t 1 t t

( )
h h h h h

= b W WX XW WX y, clculo do vetor de regresso depois de


calcular o nmero de componentes desejados.
No passo 1, os pesos so calculados usando o vetor de variveis dependentes
como inicializao do algoritmo, o que difere do algoritmo NIPALS para o clculo
das componentes principais na PCA, onde a inicializao realizada, por exemplo,
com a coluna de maior soma quadrtica em X.
A justificativa para a equao do vertor de regresso no passo 6 pode ser
descrita da seguinte maneira:
Da mesma maneira como no PCA, em PLS a matriz X pode ser decomposta
em duas matrizes, porm, na maioria das vezes, as colunas destas matrizes trazem
informaes diferentes daquelas descritas pela anlise PCA.
No PLS, os vetores t
i
formam uma base que gerada pelas colunas de X e,
visto que t
i
so ortogonais usando o algoritmo discutido acima, a base tambm

Tefilo, R. F. 48
ortogonal. Consequentemente ela deve ser expressa como uma combinao linear
de X. verificado que o espao gerado pelas primeiras h componentes t
i
tambm
gerado pelas colunas da matriz XW
h
, em que as colunas de W
h
so as primeiras h
componentes w
i
. Consequentemente, pode-se mostrar que as primeiras colunas t
i

podem ser escritas como [22]:
t 1
1 2
[ , , , ] ( )
h h h h h

= = t t t T XW P W 1.37
Se considerarmos que
t 1
( )
h h h h

= C W P W , ento sua i-sima coluna, c
i
, fornece
um vetor ponderado que nos permite calcular t
i
de X. No algoritmo SIMPLS de
De Jong (1993) [52], os vetores c
i
so calculados diretamente de uma maneira
muito elegante.
Aps entrar no ncleo iterativo do algoritmo e observ-lo como um problema
de autovetores e ento esboar algumas das propriedades dos pesos e dimenses
associadas com a matriz X, possvel ver com maior clareza o que est sendo
otimizado no PLS. Para a primeira componente, observando a combinao linear
Xc, conclui-se que de todas as possveis combinaes lineares construdas desta
maneira, maximiza a soma quadrtica da covarincia com y, ou com as colunas de
Y, para o PLS2. A soluo dada pelo primeiro vetor de pesos, w
1
, e a soma
quadrtica das covarincias de Xw
1
(= t
1
) com y
i
, portanto, a maior possvel.
Est claro que o algoritmo resolve um problema de maximizao para cada
componente extrada, embora no seja claro se h componentes tomadas como um
grupo satisfaz algum critrio timo global. Alm disso, diferente de outros
mtodos, no possvel derivar os vetores pesos como sucessivos autovetores da
mesma matriz.
O valor predito de y, aps h componente terem sido extradas, dado pela
equao 1.38, visto que ele expresso em termos de t
i
. Assim, ele pode ser escrito
como uma combinao linear de X, da seguinte maneira:
t -1 t
( )
h h h h
= y T T T T y 1.38
que mostra que os valores ajustados simplesmente a projeo de y dentro do
espao gerado por t
i
. Alm disso, foi mostrado que o espao gerado pelas colunas
de T tambm gerado pelas colunas de XW, consequentemente, y pode ser escrito
como

Tefilo, R. F. 49
t t 1 t t
( )
h h h h

= y XW WX XW WX y 1.39
o que esclarece o clculo do vetor de regresso apresentado na etapa 6.
O algoritmo SIMPLS diferente do algoritmo NIPALS em dois pontos: os
sucessivos t
i
so calculados explicitamente como combinao linear de X e a
matriz X no subtrada da matriz de resduos em nenhum passo do algoritmo.
Estes dois pontos tornam o algoritmo SIMPLS muito mais eficiente que o
algoritmo NIPALS para o clculo do PLS1.
De outro modo, Manne (1987) [40] demonstrou que o PLS1 equivalente a
um algoritmo desenvolvido por Golub e Kahan (1965) [59] para a bidiagonalizao
de matrizes. A bidiagonalizao de matrizes uma decomposio til que
frequentemente utilizada como inicializao rpida em algoritmos para o clculo
da decomposio de valores singulares de matrizes [23].
Este mtodo considera que qualquer matriz X (I x J) pode ser escrita como:
X = URV
t
1.40
em que U(I x J), V(J x J) so matrizes com colunas ortonormais (Apndice), i.e.,
elas satisfazem U
t
U = V
t
V = I, e R(J x J) uma matriz bidiagonal.
Vrios trabalhos na literatura descrevem a interessante relao do PLS1 ao
mtodo de decomposio bidiagonal [40], Lorber (1988) [60], Phatak (1993)
[22,39,58]. A decomposio bidiagonal direta que equivale ao mtodo PLS1
realizada pelo algoritmo PLSBdg, e como no algoritmo NIPALS e SIMPLS,
durante a decomposio bidiagonal, a informao em y considerada. O algoritmo
PLSBdg pode ser seguido da seguinte formulao resumida [39,60].

1. inicialize o algoritmo para a primeira componente,
t
1 1 1 1
;
t
v u v o = = X y / X y X
2. para i = 2,...,h componentes
1 1 1 1
i 1 1


t
i i i i i
i i i i
2.1. v u v
2.2. u v u
o
o


=
=
X
X


Tefilo, R. F. 50
Com ( ,..., )
h i h
v v = V , ( ,..., )
h i h
u u = U e
1 1
2 2
1 1
1
0
0
h
k k
k
o
o
o
o

| |
|
|
| =
|
|
|
\ .
R
prova-se ainda que
h h h
= XV U R e, portanto,
t
h h h
= R U XV .
Assim, com as matrizes U, V e R calculadas para h componentes, pode se
estimar a pseudoinversa Moore-Penrose de X e resolver o problema de quadrados
mnimos, como mostrado a seguir:
t 1 t


h h h h h h

= = = y Xb y U R V b b V R U y 1.41
As matrizes da bidiagonalizao so anlogas quelas derivadas pelo mtodo
SVD (Apndice), conforme equao 1.35 (X = ADP
t
). As partes em comum so
descritas pela equao 1.42.
, , A U D R P V 1.42
Observe que as matrizes no so idnticas, o que significa que os escores
(UR) e loadings (V) do PLSbdg so diferentes dos escores (AD) e loadings (P) da
PCA e portanto, do mtodo PCR. Entretanto, eles so frequentemente muito
similares.
Um detalhe conceitual importante que os escores calculados pelo algoritmo
de bidiagonalizao diferem daqueles produzidos pelos algoritmos NIPALS ou
SIMPLS por um fator de normalizao [58]. Os vetores em V so normalizados e
ortogonais, e pode se mostrar que ambos os algoritmos fornecem as mesmas
colunas {v}. Porm, Ergon(2002) [57] e Pell (2007) [58] mostraram que h uma
diferena entre a matriz reconstruda pelo mtodo PLSbdg com aquela reconstruda
pelos mtodos NIPALS e SIMPLS devido a no realizao de uma truncao
implcita (nmero do posto qumico escolhidos) na matrix X durante a
implementao dos algoritmos NIPALS e SIMPLS. Isto indica uma maior
consistncia algbrica do algoritmo PLSbdg, visto que sua base matemtica
melhor definida [23,59].

Tefilo, R. F. 51
Phatak (1993) [22] sugeriu, sem detalhes, uma relao entre as quantidades
calculadas pelo mtodo NIPALS e a decomposio bidiagonal, assim:
1
2
t
( )

= U T T T ;
1
2
t t
( ) = R T T P W; = V W 1.43
em que o subscrito indica que deve ser extrado a raiz quadrada dos elementos da
matriz T
t
T.
Embora existam relaes, os algoritmos NIPALS e SIMPLS usam um espao
para calcular o vetor de regresso, mas outro espao para representar os dados
reconstrudos. A magnitude desta diferena depende do grau de truncao do
espao que geralmente maior para maiores truncaes (poucas componentes)
[58].
Apesar de o vetor de regresso obtidos pelo algoritmo NIPALS, SIMPLS ou
PLSBgd serem os mesmos [39,58], a aproximao da matriz X pelo mtodo
bidiagonal mais confivel para clculos de reconstruo da matriz X com h
componentes para, por exemplo, deteco de amostras anmalas quando se usa a
matriz reconstruda [57,58,61].
Os escores do PLSbdg ( = T UR) podem ser usados para o clculo do vetor de
pseudo-valores singulares, que pode ser calculado conforme equao 1.44:
t
diag( ) = T T 1.44
Os pseudo-valores singulares do PLSbdg so similares aos valores singulares
determinados pela PCA. Por isso o uso do sublinhado na equao 1.44.
Comparaes com o mtodo PCR foram realizadas e em todas elas o PLS1
apresenta duas grandes vantagens [35,55]: (1) o PLS1 ajusta melhor que PCR e (2)
a regresso PLS1 usando os algoritmos SIMPLS ou PLSBgd muito mais eficiente
computacionalmente que o algoritmo que realiza a decomposio PCR. Assim, fica
esclarecido o grande uso deste mtodo em vrias reas cientficas. Entre os
algoritmos PLS, tem sido provado que o algoritmo PLSBgd apresenta eficincia
computacional equivalente ou levemente maior que o algoritmo SIMPLS, sendo
este ltimo mais eficiente que o NIPALS [50].

Tefilo, R. F. 52
- Construindo e validando o modelo
Do ponto de vista prtico, o modelo para calibrao multivariada deve ser
validado durante a sua construo. Este tipo de validao, realizada durante a
construo do modelo conhecida como validao interna. Durante a validao
interna possvel escolher com maior preciso o nmero de componentes do
modelo, detectar amostras anmalas e verificar preliminarmente sua robustez e
capacidade de previso. Em uma segunda etapa, o modelo construdo validado
para amostras externas, ou seja, amostras que no foram usadas durante a sua
construo. Esta etapa conhecida como validao externa e tem como nico
objetivo verificar a capacidade de previso do modelo e garantir previses
confiveis para concentraes/propriedades de amostras desconhecidas.
Neste sentido, dois conjuntos devem ser separados para realizar as duas
etapas. Um deles para a construo, conhecido tambm como conjunto de
calibrao ou treinamento e outro conhecido como conjunto de previso ou teste
(Figura 1.13).

Figura 1.13. Esquema usado para construir e validar o modelo.
Apesar de ser bvio, vale ressaltar que todas as transformaes e pr-
processamentos so realizados antes da execuo da validao interna e externa.
Diversos modelos de regresso so construdos na validao cruzada, porm,
somente um, i.e., o timo, construdo e usado para previses de conjunto externo.

Tefilo, R. F. 53
Na etapa de validao interna o procedimento conhecido como validao
cruzada normalmente empregado [62,63]. Basicamente, a validao cruzada
executada dividindo os dados com I
cv
amostras em s
i
(i = 1, 2, 3...S) subconjuntos
de aproximadamente igual tamanho. Cada subconjunto s
i
pode ter, por exemplo,
uma dimenso de 1 a
2
cv
I
amostras removidas aleatoriamente ou no. Para cada
componente, modelos so construdos S vezes, sendo que em cada vez, deixa-se um
subconjunto s
i
separado para previso no respectivo modelo construdo sem ele
(Figuras 1.14 e 1.15). Isto ocorre at que todos os subconjuntos em s
i
sejam
testados. Se S igual a I
cv
, o mtodo conhecido como leave-one-out, conforme
ilustrado na Figura 1.14. Embora o leave-one-out seja um mtodo bastante usado,
ele no recomendado quando se tem muitas amostras, visto que modelos com
sobreajuste podem ser obtidos com a escolha errada do nmero de componentes
[43,63].

Figuas 1.14. Esquema do mtodo leave-one-out para validao cruzada.

Tefilo, R. F. 54

Figura 1.15. Exemplo de validao cruzada leave-n-out para mais de uma amostra
excluda.
As amostras previstas para os modelos durante a validao cruzada so
comparadas com seus valores conhecidos. Parmetros estatsticos so calculados
para avaliar em que situao o modelo apresentou maior capacidade de previso.
Os parmetros usados em toda tese foram a raiz do erro quadrtico mdio de
validao cruzada (RMSECV) apresentada na equao 1.45 e o coeficiente de
correlao de validao cruzada (r
cv
) apresentada na equao 1.46. Ambos obtidos
a partir dos valores estimados por validao cruzada e os valores conhecidos.
2
( )
RMSECV
cv
I
i i h
i
h
cv
y y
I
=

=

1
1.45

1
2 2
1
( )( )
( ) ( )
cv
cv
I
i i
h
i
cv
I
i i
i
y y
r
y y
=
=

=

y y
y y
1.46

Tefilo, R. F. 55
em que
i
y o valor estimado para a amostra i, no includa na construo do
modelo, h o nmero de componentes no modelo, I
cv
o nmero de amostras da
validao interna, y a mdia dos valores em y.
Na etapa de validao externa, um conjunto de variveis independentes
fornecido ao modelo com h componentes para verificar o seu poder de previso. A
habilidade de previso do modelo foi calculada em toda a tese usando erro
quadrtico mdio de previso (RMSEP) conforme apresentado na equao 1.47 e
o coeficiente de correlao de previso (r
p
) apresentada na equao 1.48
2
( )
RMSEP
p
I
i i
i
p
y y
I
=

=

1
1.47
1
2 2
1
( )( )
( ) ( )
p
p
I
i i
i
p
I
i i
i
y y
r
y y
=
=

=

y y
y y
1.48
em que
i
y o valor estimado pelo modelo final para a amostra i, I
p
o nmero de
amostra no conjunto de previso, y a mdia dos valores em y. Uma vez o modelo
ter sido construdo e validado, ele pode ser usado para previses de novas amostras.
Seleo de Variveis em Calibrao Multivariada
Apesar de mtodos para calibrao multivariada tais como PLS e PCR serem
aptos a trabalhar com uma grande quantidade de variveis altamente
correlacionadas, independente do nmero de amostras, est bem definido e aceito
que as melhores previses so obtidas quando variveis apropriadas so
selecionadas [64-67]. A seleo de variveis uma tcnica que ajuda a identificar
um subconjunto de variveis que so, para um dado problema, as mais teis para
um modelo de regresso mais preciso e exato. Alm disso, o subconjunto
selecionado pode ajudar a tornar o modelo quimicamente mais facilmente
interpretvel o que algo muito importante na rea de anlise sensorial, nos
estudos de relao quantitativa estrutura-atividade dentre outras [66,68-70]. Isto

Tefilo, R. F. 56
ocorre, pois, em um conjunto de centenas ou milhares de variveis, algumas delas
podem ser rudos e/ou conter informaes irrelevantes. Assim, o objetivo da
seleo de variveis reduzir significativamente o nmero de variveis para obter
modelos mais simples, interpretveis e robustos [71].
Um grande nmero de procedimentos para seleo de variveis est disponvel
na literatura [70,72], a maioria focada em seleo de comprimentos de onda em
espectroscopia. Estes procedimentos podem ser distinguidos um do outro pelo
mtodo de busca que localiza um subconjunto timo e pelo mtodo objetivo para
encontrar as variveis timas [68].
Aqui ser apresentada uma nova estratgia que ser empregada para selecionar
variveis em dados voltamtricos e espectroscpicos. Em eletroanlise, este mtodo
ser apresentado como uma alternativa ao algoritmo gentico (GA), que tem sido
usado nesta rea, como nico mtodo capaz de selecionar variveis com sucesso
[71,73,74].
O GA um mtodo de seleo de variveis parcimonioso baseado na pesquisa
sistemtica probabilstica inspirada no mecanismo de seleo natural [75]. Em
vrias reas da qumica o GA tem sido amplamente usado como seleo de
variveis [76]. Aqui ele ser usado apenas para fins de comparao com o mtodo
proposto.
- Algoritmo Gentico para Seleo de Variveis
Embora haja uma variedade de mtodos de seleo de variveis, o GA fornece
um mtodo direto baseado na sobrevivncia das variveis mais aptas como uma
aproximao para modelar os dados.
A tcnica de seleo natural para selecionar variveis em calibrao
multivariada pode ser descrita da seguinte maneira [77]: dado uma matriz X de
variveis independentes e um vetor y de varivel dependente, o algoritmo escolhe
um subconjunto de variveis em X e, usando algum mtodo de regresso
multivariada (aqui, o mtodo PLS) e alguma estratgia de validao cruzada,
determinado o valor de RMSECV para o subconjunto de variveis. O algoritmo
gentico usa este conceito iterativamente para localizar o subconjunto ou
subconjuntos que fornece(m) o menor valor de RMSECV.

Tefilo, R. F. 57
A primeira etapa do GA gerar um grande nmero (e.g., 32, 64, 128) de
selees aleatrias das variveis independentes (termos iniciais) e calcular o
RMSECV para cada subconjunto. O RMSECV usado para cada modelo PLS o
menor obtido entre todos os calculados, limitado pelo nmero de componentes
previamente definido. Cada subconjunto de variveis chamado de indivduos ou
cromossomos e o cdigo sim(1)/no(0), que indica quais variveis sero usadas o
gene para aquele indivduo. Normalmente, 1 indica a maior aptido da varivel e 0,
o contrrio. A combinao de todos os indivduos testados a populao. Os
valores de RMSECV, descritos como aptido de um indivduo, indica a capacidade
de previso das variveis selecionadas naquele indivduo. Devido variao dos
nveis de rudo e variveis interferentes, a aptido dos diferentes indivduos na
populao se estender por uma faixa de valores.
A segunda etapa do GA a seleo. Nesta etapa, descartam-se os indivduos
com valores de RMSECV maiores que o valor de RMSECV mediano (obtido a
partir de todos os modelos). Neste ponto, a populao reduzida para a metade de
seu tamanho original.
Para substituir os indivduos descartados, o GA cruza os indivduos restantes.
Isto feito por um dos dois mtodos: cross-over simples ou duplo. No cross-
over simples, os genes de dois indivduos aleatoriamente selecionados so
divididos em algum ponto aleatrio do gene. A primeira parte do gene do indivduo
A trocada com a primeira parte do individuo B, e os dois genes hbridos formam
dois novos indivduos (C e D) para a populao. No cross-over duplo, o
cruzamento muito similar ao simples exceto que, no duplo, dois pontos aleatrios
no gene so selecionados e a poro do meio dos dois genes trocada. A grande
diferena na prtica que o cross-over duplo gera tipicamente novos
subconjuntos de variveis com maior nmero de variveis iguais aos dos
cromossomos de origem.
Aps a adio dos novos indivduos populao, todos os genes individuais
tm a chance de sofrer mutao aleatria (taxa de mutao). Isto permite, dentro de
uma chance finita de adio ou remoo, considerar variveis que possam estar
super- ou sub- representadas na populao. As mutaes so necessrias para
superar alguns problemas que podem ocorrer durante a seleo. O problema mais

Tefilo, R. F. 58
essencial a ser resolvido que se uma varivel no for selecionada em qualquer
cromossomo original, ela nunca ser selecionada nas geraes futuras se a mutao
no existir. Uma mutao simplesmente uma inverso do gene em um indivduo.
Finalmente, depois de todos os indivduos terem sido emparelhados e
cruzados, a populao retorna para o tamanho original e o processo pode
novamente continuar na etapa de avaliao de aptido (RMSECV) i.e., na segunda
etapa.
A finalizao do GA pode ocorrer depois de um nmero de iteraes finito
(nmero mximo de geraes) ou depois de alguma percentagem de indivduos na
populao estarem usando subconjunto de variveis idnticas (percentagem para
convergncia).
H trs grandes problemas na implementao do GA, que so a inicializao,
o sobre ajuste e o tempo computacional [76]. Na inicializao, uma alta correlao
entre variveis codificadas em pontos adjacentes pode impedir o GA de remover
variveis indesejadas, especialmente quando o cross-over simples empregado. O
sobreajuste um risco bem conhecido do GA. A previso casustica acoplada com
a tendncia do GA em transmitir trechos dos cromossomos atravs de
recombinaes, faz dele predisposto a obter excelentes valores de RMSECV, mas
as variveis selecionadas mostram um comportamento pobre para amostras
externas. O ltimo deles torna o GA praticamente invivel para grandes conjuntos
de dados. Neste ponto, selees prvias podem ajudar a resolver o problema, mas
mesmo para pequenos conjuntos de dados, ele consome, relativamente, muito
tempo para sua execuo.
- Seleo dos Preditores Ordenados OPS


prtica comum entre os quimiometristas visualizar grficos de vetores
informativos ou prognsticos para extrair informaes desejadas em dados
multivariados. Os vetores informativos so aqueles obtidos a partir de algum
tratamento matemtico dos dados, que tornam mais visveis comportamentos
padres das variveis, sejam das independentes, das dependentes ou da relao
entre as duas.

Tefilo, R. F. 59
Em calibrao multivariada, as regies onde h maior intensidade do sinal de
algum vetor considerado informativo so intuitivamente relacionadas com
possveis regies de variveis dos dados originais que podem melhorar as
previses. De fato, se o vetor visualizado trouxer a informao procurada, isto
realmente verdade e a seleo de variveis est realizada, mesmo sem uma
escolha criteriosa da regio desejada.
Uma caracterstica desejvel em um mtodo de seleo de variveis, no que se
refere aplicabilidade e eficincia sobre diferentes tipos de dados, so suas
caractersticas universais. Em qumica, por exemplo, diferentes tcnicas analticas
fornecem diferentes tipos de variveis, cada uma com caractersticas bem definidas
e peculiares, como altas ou baixas correlaes e com diferentes comportamentos
(banda nica, muitas bandas e picos, muitos picos, mal comportadas ou aleatrias).
O uso de vetores prognsticos, por exemplo, universal, visto que a informao
extrada por eles intrnseca das variveis, livre de sua natureza.
Muitos autores [56,72,78] e o software Pirouette [61] apresentam o vetor de
regresso com potencial ferramenta informativa para auxiliar na seleo de
variveis em calibrao multivariada. Variveis com pequenos coeficientes de
regresso no contribuem significativamente para a previso e, portanto, podem ser
eliminadas. O vetor de regresso pode ser considerado ainda, como uma soma
ponderada dos loadings includos no modelo [61]. Portanto, o formato do vetor
muda dramaticamente com o nmero de componentes quando informaes
importantes so includas e poucas mudanas ocorrem quando rudos passam a ser
modelados e toda informao j est nas componentes.
Outros vetores informativos em calibrao multivariada para seleo de
variveis so aqueles que relacionam, de maneira univariada, cada varivel
independente com a varivel dependente e retira parmetros desta relao, como
por exemplo, a correlao [61,70,79-81]. Normalmente, variveis com pobres
correlaes no trazem informaes importantes e podem ser excludas. Entretanto,
uma ateno maior deve ser considerada, visto que este vetor traz informaes
univariadas e no multivariadas.
Outros vetores apresentados na literatura [72,82,83] so guiados pela mesma
finalidade e se diferenciam somente na maneira de busca objetiva das informaes.

Tefilo, R. F. 60
Ambos so focados em realar quais so as variveis originais mais importantes
para se obter boas previses da varivel dependente em questo.
A estratgia intuitiva de usar um vetor informativo mais objetiva e conduz
mais diretamente para a interpretao das variveis selecionadas e tambm, para
boas previses de novas variveis externas i.e., o risco de sobre ajuste menor que
no GA, por exemplo.
Embora o uso de vetores prognsticos apresente grande potencial para a
seleo de variveis, pouco tem sido feito em automatizao de algoritmos,
definies de critrios de seleo e combinaes entre vetores. Estes fatores
certamente tornaro a seleo ainda mais seletiva e objetiva.
A metodologia apresentada aqui supre esta necessidade, introduzindo uma
estratgia simples e intuitiva para seleo de variveis, baseada nos vetores
informativos e nas combinaes entre eles.
De um modo geral, o ncleo do mtodo est na obteno de um vetor que
contenha a informao da localizao das melhores variveis independentes para
previso. Normalmente, este vetor pode ser obtido diretamente a partir de clculos
realizados com ambas as variveis, i.e. independentes e dependente ou a partir de
combinaes de distintos vetores, obtidos com o mesmo objetivo. Logicamente, a
dimenso do vetor deve ser igual ao nmero de variveis independentes e cada
posio do vetor deve estar alinhada com a sua varivel independente
correspondente. Em uma segunda etapa, a partir do vetor prognstico gerado, as
variveis independentes originais (colunas da matriz X) so decrescentemente
ordenadas de acordo com a ordem dos seus valores correspondentes, contidos no
vetor. Os maiores valores no vetor informativo indicam a posio das variveis
independentes originais mais importantes (Figura 1.16). Como conseqncia, o
algoritmo foi nomeado como seleo dos preditores ordenados (OPS

, de
Ordered Predictors Selection).
Na terceira etapa, as variveis ordenadas so avaliadas usando alguma
estratgia de validao cruzada com algum mtodo de regresso multivariada. Os
modelos so construdos e avaliados sobre uma janela de variveis e posteriormente
sobre a janela acrescida de um incremento fixo de variveis e assim
sucessivamente, at que todas as variveis ou uma percentagem do total, sejam

Tefilo, R. F. 61
adicionadas janela. Parmetros de qualidade dos modelos so obtidos a cada
avaliao, para posterior comparao.
Na quarta e ltima etapa, os conjuntos de variveis avaliados (janela inicial e
janela mais incrementos) so comparados utilizando os parmetros de qualidade
calculados. O conjunto de variveis que apresentarem os melhores parmetros de
qualidade contm as variveis que apresentam a melhor capacidade de previso
para o modelo construdo e, portanto, so estas as variveis selecionadas.

Figura 1.16. Etapas da seleo de variveis usando o OPS
Especificamente, o algoritmo usado nesta tese apresenta as seguintes
caractersticas:
1. Obteno dos vetores informativos:
i. vetor de regresso para o modelo PLS (equao 1.41);
ii. vetor de correlao de cada coluna em X (autoescaladas) com y
(autoescalado) (equao 1.49);
t
1
,
1
I J I
i
r
I

=

X y
x y 1.49

Tefilo, R. F. 62
iii. o inverso das somas quadrticas das colunas da matriz de resduos X com h
componentes definida como q conforme equao 1.50.
t
1


h h j
j j
q
e e
= = E X X 1.50
em que e
j
a j-sima coluna de E
h
. O inverso usado pois espera-se que variveis
informativas apresentem baixos valores na matriz de resduos;
iv. combinaes entre estes vetores;
2. Mtodo de regresso: modelo PLS usando o algoritmo bidiagonal;
3. Validao cruzada: mtodo leave-N-out;
4. Parmetros de qualidade avaliados: RMSECV e r
cv
, obtidos para o nmero
de componentes com menor valor da razo entre RMSECV e r
cv
.
As vantagens deste mtodo so: (1) aplicabilidade para qualquer tipo de dado
(voltamtrico, espectroscpico, cromatogrficos, variveis de processo;
QSAR/QSPR, espectrometria de massa, ressonncia nuclear magntica, etc); (2)
objetividade na seleo de variveis que apresentam informaes qumicas
relevantes, visto que os vetores informativos so aqueles selecionados; (3)
necessidade de poucos parmetros de entrada para executar a seleo, ao contrrio
do GA; (4) mtodo computacionalmente eficiente e com aptido para se tornar
completamente automtico; (5) capacidade de ser adaptado para seleo de
variveis em dados de ordem superior (Captulo 7), em seleo de variveis por
intervalos e em anlise discriminante, como o PLS-DA, por exemplo.
A aplicao deste mtodo ser realizada na Parte Experimental desta tese e
seus resultados sero comparados com os resultados do GA.
Sinal Analtico Lquido e Parmetros Analticos
Os modelos de calibrao multivariada podem usar sinais (e.g.
voltamogramas) que no so seletivos para uma propriedade de interesse (e.g.
concentrao de certo analito). [84]. Porm, pesquisas tm sido realizadas para
descrever a parte do sinal modelado que est quantitativamente relacionada
propriedade a ser predita. Esta teoria foi definida como Sinal Analtico Lquido
(NAS) e tem levantado muito interesse em calibrao multivariada.

Tefilo, R. F. 63
O primeiro trabalho que apresentou um conceito similar do NAS foi
realizado por Morgan [85] em 1977 para calibrao multivariada direta (clssica).
Este trabalho contm alguns erros e no foi muito bem divulgado. Em 2003, um
trabalho de Ferr e Faber [84], reconheceu o trabalho de Morgan como o pioneiro,
mas no como o primeiro divulgador na introduo do conceito do NAS. Isto se
deve, pois, em 1986, o trabalho de Lorber [86] apresentou uma elegante
interpretao desta funo para calibrao multivariada por quadrados mnimos
clssicos e em 1997, Lorber et al. [87] apresentaram, pela primeira vez, o clculo
do NAS para calibrao multivariada inversa. Assim, os trabalhos de Lorber so
reconhecidos pela comunidade cientfica especializada como os germinais para a
teoria do NAS.
Atualmente muitas aplicaes deste vetor em calibrao multivariada tm sido
descritas, tais como: seleo de variveis [88]; deteco de amostras anmalas [87]
[88]; desenvolvimento de novos mtodos de calibrao [89]; desenvolvimento de
pr-tratamentos de dados [90]; avaliao do desempenho de modelos de calibrao
[91] e clculo de parmetros analticos (figuras de mrito) [87,92-94].
Nesta tese, clculos de alguns parmetros analticos em calibrao
multivariada inversa sero realizados com o auxilio do vetor NAS e, portanto, uma
breve descrio dos mtodos para obter este vetor ser realizada.
Geometricamente, o vetor NAS representa a poro do vetor da mistura que
reside no espao ortogonal aos sinais dos componentes puros de todas as espcies
interferentes em um sistema aditivo linear [95], conforme apresentado na Figura
1.17. Outra definio para o vetor NAS que segue o mesmo conceito anterior : o
vetor NAS para um componente a parte do seu sinal na mistura que ortogonal
ao sinal de outros componentes (considerado para a calibrao) [84].
Estas duas definies so corretas quando se considera a calibrao direta i.e.
quadrados mnimos clssico. Para calibrao inversa (PLS, PCR, MLR) estas
definies no so prontamente aptas e a mais indicada : O vetor multivariado
NAS a parte do sinal da mistura que til para previso [84].
O sinal analtico lquido uma propriedade nica do problema de calibrao
que independente do modelo estimado e por alguma extenso, independente
tambm do mtodo de calibrao. Por essa razo, pode ser impossvel comparar

Tefilo, R. F. 64
diferentes modelos de calibrao competitivos pelos seus vetores NAS, visto que
eles sero os mesmos, independente do mtodo. Neste contexto, muitas diferentes
aproximaes podem ser razoveis para estimar o vetor NAS, mas elas so todas
interpretadas como tentativa para estimar o mesmo e verdadeiro sinal analtico
lquido.

Figura 1.17. Ilustrao da orientao e comprimento do vetor do sinal analtico lquido
em relao ao plano dos interferentes e sinal analtico do componente puro
Aqui sero apresentados todos os clculos disponveis na literatura para se
calcular o vetor NAS para calibrao multivariada inversa. Dois tipos de mtodos
esto disponveis: os baseados na anulao de posto e os baseados na projeo
ortogonal do sinal sobre o vetor de regresso. Posteriormente, o uso do NAS ser
mostrado para o clculo dos parmetros analticos, que sero aplicados nesta tese.
- Mtodos baseados na anulao de posto
- Clculo original: o mtodo de Lorber
O clculo do vetor NAS em calibrao multivariada inversa apresentado por
Lorber et al. (1997) [87] pode ser descrito como segue.
O objetivo inicial eliminar a contribuio do k-simo constituinte de
interesse presente nos sinais i.e., em X. Para realizar este clculo os dados X e y
so suficientes. Assim, possvel calcular o espao do sinal gerado por todos os

Tefilo, R. F. 65
constituintes exceto do k-simo analito. Esta eliminao pode ser realizada
resolvendo o problema de anulao de posto.
Primeiro a matriz X reconstruda usando h componentes significativas via
PLS (algoritmo bidiagonal) ou PCR, o que fornece uma matriz

X estimada.
A anulao de posto em um espao de dimenso h dada por
t


k k
= X X y x 1.51
em que
k
y o vetor de concentraes estimadas (

k k
+
= y XX y ) para o k-simo
analito e x uma combinao linear das linhas de

X, que deve incluir a


contribuio do sinal do k-simo constituinte. Na configurao regular da anulao
de posto, o vetor x o sinal puro do analito k. Porm, alguns autores [92,96]
comentam que qualquer sinal x, com grande contribuio do analito k obtido de X,
pode ser usado para esta proposta. Porm, fcil provar que a escolha de diferentes
combinaes lineares deve afetar apenas o valor de . A anulao de posto far

k
X livre da contribuio do k-simo componente. O posto de

k
X h-1. O escalar
calculado da seguinte maneira:
t
1


k
+
=
x X y
1.52
O vetor

k
+
X y o vetor de regresso estimado em calibrao multivariada
inversa.
O sinal analtico lquido para uma amostra dado por:
t t
,

( ( ) )
nas
k i k k i
+

= x I X X x 1.53
Visto que
,

nas
k i
x livre de interferentes, possvel represent-lo
geometricamente sem perda de informao, e.g. usando a sua norma euclidiana.
, ,

nas
k i k i
NAS = x 1.54
Como pode ser observado, o valor calculado
,

k i
NAS um escalar que
representa a contribuio quantitativa do analito k para a amostra i. Assim, o valor
do escalar NAS calculado para cada amostra e, portanto, uma representao
pseudo-univaridada, rigorosamente provada como exata [97], pode ser realizada.

Tefilo, R. F. 66
Portanto, para o modelo inverso, a concentrao do analito expressa como funo
do escalar NAS. Neste caso, a inclinao da reta do grfico de calibrao
identificada como a sensibilidade inversa e, conseqentemente, um baixo valor da
sensibilidade inversa desejado, visto que orienta para uma pequena quantidade de
propagao de erro [97]. Entretanto, como apontado por Faber [98], esta definio
no vlida para modelos no centrados em situao onde a resposta prevista
com valores abaixo de zero.
- O mtodo de Xu e Schechter
Alguns meses aps Lorber et al. (1997) terem apresentado seu mtodo [87],
Xu e Schechter (1997) [89], conterrneos de Lorber, propuseram uma nova
metodologia para se obter o vetor NAS em calibrao multivariada inversa.
Nesta proposta o vetor de concentraes
k
y usado para definir
k
X . A
matriz de calibrao X escalada dividindo cada linha da matriz X pelo
correspondente valor de
k
y , de tal maneira que cada vetor linha contenha a mesma
contribuio do analito.
esc
i
i
i
y
=
x
x 1.55
No prximo passo a matriz escalada centrada na mdia removendo a
contribuio constante do analito.
t
,
esc esc
k i i
= x x 1 x 1.56
em que
esc
x um escalar correspondente mdia dos elementos do vetor
esc
x .
A partir daqui, retorna-se equao 1.53 at o clculo do escalar NAS.
Na equao 1.56 os autores no recomendam escolher um nmero timo de
componentes para reconstruir a matriz X, mas utilizar a matriz original. Desta
forma, o trabalho prope um mtodo de calibrao multivariada livre da escolha de
um nmero de fatores timos, tendo como objetivo uma anlise automatizada.

Tefilo, R. F. 67
- O mtodo de Goicoechea e Olivieri
Goicoechea e Olivieri (1999) [92] propuseram uma aproximao similar
descrita por Xu e Schechter (1997) [89].
O mtodo consiste em obter uma mdia dos sinais de calibrao (equao
1.57) e a partir desta mdia uma aproximao da contribuio do analito de
interesse estimada e subtrada da matriz de dados X, conforme equao 1.58.
1
1
I
m i
i
I
=
=

x x 1.57
t
m
k
=
yx
X X
y
1.58
em que y um escalar correspondente mdia dos elementos do vetor y .
Para o clculo do vetor NAS, O resultado da equao 1.58 utilizado na
equao 1.53.
- Mtodos baseados no vetor de regresso
- O mtodo de Faber
Klaas Faber (1998) [99] apresentou uma maneira altamente eficiente para
realizar o clculo do vetor NAS, que no realiza a anulao de posto. Este mtodo
baseia-se no uso do vetor de regresso uma vez que este vetor ortogonal ao
espectro dos interferentes. (Se os espectros dos interferentes variam devido
restrio de ortogonalidade o vetor de regresso para o analito contra varia) [99].
Isto consistente com a idia que os interferentes so implicitamente modelados
em calibrao inversa.
O produto interno na equao
t
i i
y c = + b x (c nesta equao o resduo) dar
apenas a contribuio de uma parte do espectro da mistura x, que ortogonal ao
espectro dos interferentes; esta parte o vetor NAS. Consequentemente o sinal da
mistura pode ser dividido em duas contribuies mutuamente ortogonais como:
nas
i i i

= + x x x 1.59
em que
i

x o vetor ortogonal ao vetor NAS.



Tefilo, R. F. 68
Se
t t
( )
nas nas
i i i i i
y y c c

= + + = + b x x b x , o vetor NAS pode ser calculado


usando a seguinte equao:
t t
,
( ) ( / )
nas
k i i i
y y
+
= = x b b b b 1.60
Originalmente,
i
y foi sugerido como o valor esperado, mas na prtica foi
substitudo pelo estimado [84,96]. Assim, a equao que deve ser aplicada :
t t
,
( ) ( / )
nas
k i i i
y y
+
= = x b b b b 1.61
- Bro e Andersen: provando o mtodo de Faber
Recentemente, Bro e Andersen (2003) [96] refinaram o clculo proposto por
Faber (1998) [99]. Na realidade, o mtodo conceitualmente o mesmo, entretanto
estes autores fizeram uma descrio mais detalhada, provando a veracidade deste
clculo.
Neste mtodo, as matrizes
k
X e
k
X podem ser definidas, dentro dos
fundamentos de um dado modelo de calibrao (posto reduzido), da seguinte
maneira: O espao nulo do modelo pode ser indiferente. Para PCR, por exemplo, o
espao nulo dado pela matriz de projeo
+
I PP , em que P (J x h) a matriz de
loadings com h dimenses.
Ao invs de dividir os dados em duas diferentes partes como usualmente
feito, na derivao do NAS, o modelo dividido em trs contribuies, todas
ortogonais entre si, i.e:
k k e
= + + X X X X 1.62
A matriz
k
X a parte do sinal do analito que ortogonal ao sinal do
interferente e ao sinal do rudo (
e
X ). Enquanto
k
X a parte de X que est no
subespao gerado pelos interferentes (incluindo a parte do sinal analtico dentro
deste subespao).
Dentro do espao do modelo dado por
+
PP , a parte dada pelo vetor de
regresso b assumida estar na mesma direo do vetor NAS. Por outro lado, as
predies so influenciadas por outro vetor, alm daquele relacionado com variao
do analito. Conseqentemente o espao nulo do modelo deve ser equivalente ao
espao gerado por
k
X . Portanto, a matriz
k
X pode ser encontrada de:

Tefilo, R. F. 69
( )
k
+ +

= X XPP I bb 1.63
Como b definido como sendo o espao gerado pelas colunas de P, assim
=
+
PP b b e consequentemente,
k
+ + +
= = X XPP bb Xbb 1.64
Isto significa que o vetor NAS simplesmente encontrado pela projeo
ortogonal dos sinais dentro do espao gerado pelo vetor de regresso. Desta forma,
o vetor NAS do sinal de certa amostra, x
i
dado por:
t 1 t t 1
,
( ) ( )
nas
k i i i i
y
+
= = = x bb x b b b b x b b b 1.65
Note que a equao 1.65 e a equao 1.61 so idnticas.
Bro e Andersen (2003) em seu trabalho mostraram que os mtodos baseados
na anulao de posto apresentam algumas desvantagens em relao ao mtodo
baseado no vetor de regresso. A primeira delas que o mtodo baseado no vetor
de regresso mais geral e teoricamente mais consistente. A segunda que os
outros mtodos no podem ser usados para acessar diferenas nos parmetros
analticos entre, por exemplo, regresses PLS e PCR, visto que eles
proporcionariam resultados muito parecidos para ambos os modelos, mesmo
embora isto seja obviamente no razovel.
Tendo em vista estas consideraes, nesta tese ser empregado o mtodo
proposto por Faber (1998) [99] e refinado por Bro e Andersen (2003) [96].
- Parmetros analticos em calibrao multivariada inversa
Figuras de mrito tem se tornado muito importantes a fim de caracterizar,
comparar e desenvolver novos mtodos multivariados. Muitas delas esto
estritamente relacionadas ao conceito do sinal analtico lquido, tais como a
sensibilidade e a seletividade e outros como os limites de deteco (LOD) e
quantificao (LOQ) so calculados seguindo os ltimos avanos para a avaliao
de incertezas em calibrao multivariada.
O conceito de NAS aparece um tanto naturalmente em calibrao multivariada
considerando que uma amostra prevista apresente uma contribuio variada de
outros componentes. Portanto, quando os vetores NAS das amostras diferem em

Tefilo, R. F. 70
forma, eles podem estar trazendo partes diferentes do espao gerado.
Consequentemente, qualquer parmetro analtico calculado a partir destes vetores
para representar a qualidade do modelo pode de fato ser enganosa e afetada pela
variao que no capturada pelo modelo de regresso [96]. Assim, para evitar
imprecises nos clculos dos parmetros analticos que usam o vetor NAS, deve-se
encontrar e remover todas as amostras anmalas.
Os parmetros analticos sensibilidade, seletividade e limite de deteco, para
calibrao multivariada, sero descritos a seguir.
- Sensibilidade
A sensibilidade refere-se medida de quo fortemente o analito de interesse
responde para uma especfica medida. Em outras palavras, a sensibilidade diz em
que extenso a resposta, devido a um particular analito, varia como funo de sua
concentrao. Assim, a unidade da sensibilidade sinal/concentrao. Para o
modelo inverso, a sensibilidade o inverso da inclinao do grfico pseudo-
univariado [93].
Em termos do vetor de regresso a sensibilidade dada pela equao 1.66 [93]
1
SEN =
b
1.66
Em termos do NAS, a sensibilidade dada pela equao 1.67 [87]
SEN
nas
i
i i i
i
y
= =
x
sen sen 1.67
Observe que na equao 1.66 a sensibilidade calculada diretamente,
enquanto que na equao 1.67 o clculo realizado para cada amostra. Ambos os
clculos atingem resultados quase idnticos, mas nesta tese o clculo ser realizado
empregando a equao 1.67. A mdia de todas as sensibilidades ser usada.
- Seletividade
A IUPAC define a seletividade como uma medida da confiabilidade de um
mtodo usado para determinar um analito de interesse em uma mistura ou matriz

Tefilo, R. F. 71
sem a interferncia de outras espcies de comportamento similar. Em uma
linguagem mais precisa, um mtodo completamente seletivo contra um particular
interferente se o resultado fornecido por ele independente da concentrao do
interferente [100].
A seletividade varia entre 0 e 1, em que 0 significa que a anlise impossvel
visto que o sinal do analito igual a uma combinao linear do espectro do
interferente. Um valor igual a 1 indica que no h interferentes [101].
importante notar que a seletividade definida aqui dependente da amostra e
ser determinada pela quantidade de analito de interesse relativa aos interferentes.
Em termos de vetor de regresso a seletividade dada pela equao 1.68 [93]:
1
SEL
i
i
=
b x
1.68
Em termos do NAS, a seletividade dada pela equao 1.69 [87]:

SEL
i
i
i
NAS
=
x
1.69
Novamente este parmetro calculado para cada amostra e, para divulgar a
seletividade como um nico nmero, a mdia ser calculada. Espera-se que o uso
da mdia descreva bem o valor da seletividade do modelo se as amostras
apresentarem um comportamento homogneo [92,102,103].
- Limite de deteco (LOD)
A norma ISO 11843 define o limite de deteco (LOD) como a verdadeira
concentrao lquida do analito em um material a ser analisado que conduz, com
probabilidade maior que zero, para a correta concluso que a concentrao no
material analisado diferente daquela em um material livre do analito analisado.
De todos os parmetros analticos calculados para calibrao multivariada o
clculo do LOD o mais questionado e ainda no bem definido at o momento [93]
[104]. Booksh e Kowalski (1994) [93], apesar de apresentarem uma expresso para
o clculo do LOD, afirmam que este clculo no faz sentido, visto que a quantidade

Tefilo, R. F. 72
de analito que pode ser detectado uma funo da concentrao de cada
interferente.
Recentemente, vrios trabalhos tm avanado propondo clculos mais
precisos deste parmetro em calibrao multivariada [104-107], inclusive para
calibrao de dados de segunda ordem [104,108].
Nesta tese quatro diferentes estimativas sero realizadas para o LOD de
maneira a observar os mritos e falhas de cada uma.
LOD usando o coeficiente de regresso e o rudo
O clculo uma extenso dos mtodos usados para o clculo do LOD em
calibrao univariadas [93]:
LOD 3 r o = b 1.70
em que r o a norma do vetor de desvios padres das colunas da matriz de rudos
e b a norma do vetor de regresso.
LOD usando as hipteses de falso positivo e falso negativo
Mtodo de Ortiz
Este mtodo se baseia na extrapolao da equao de regresso obtida com os
valores previstos e medidos da calibrao multivariada para o valor zero de
concentrao. A base estatstica para este mtodo foi elaborada por Clayton et al.
(1987) [109] e divulgada primeiramente para modelos de ordem zero [110] e
recentemente Sanz et al. (2001) [107], mostraram a possibilidade de aplicar este
mtodos para modelos PLS com dados de voltametria de pulso diferencial (DPV).
Ortiz et al. (2003) [104] provaram com uma srie de diferentes tipos de dados, que
esta maneira de estimar o LOD no se limita calibrao univariada (ordem zero),
mas tambm apta a ser aplicada a sinais no especficos de primeira, segunda e
altas ordens [111,104] com dados voltamtricos ou espectroscpicos.
O mtodo consiste em construir um modelo de calibrao e aplicar o teste de
Neyman-Pearson para a concentrao y do analito.
Hiptese nula: :
o o
H y y = i.e., concentrao zero.
Hiptese alternativa: :
A o
H y y >

Tefilo, R. F. 73
Probabilidade do erro tipo I: pr{ }
o o
y y quando y y = > =
Probabilidade do erro tipo II: pr{ }
o o
y y quando y y = = >
O modelo univariado a ser construdo : x a by e = + + , em que x a varivel
independente (sinal) e y a concentrao.
Se a deciso for estabelecida na base da resposta x, a regio crtica do teste
pode ser escrita como CR = {x >x
c
}, em que x
c
o valor crtico da resposta.
Levando esta deciso para a curva de calibrao e estimando a concentrao a
partir do sinal, obtemos a expresso para o LOD [111,104]:
( , )
LOD

o
y
w
b
o | o A
= 1.71
em que o o desvio padro residual da regresso (Equao 1.72),

b o coeficiente
da regresso univariada, w
yo
(Equao 1.73) uma funo da posio dos padres,
y
i
, na curva de calibrao e inversamente proporcional ao nmero de replicatas da
amostra, K e ao nmero de padres no modelo de calibrao, I. De uma maneira
mais direta o produto
o
y
w o uma estimativa do erro no intercepto. O fator ( , ) o | A
depende da probabilidade e o | (Equao 1.74) e do nmero de graus de liberdade
(I 2). Este parmetro pode ser obtido ou numericamente [112]
ou atravs de tabelas estatsticas e representa o parmetro de no-centralidade de
uma distribuio t no central.
2
2
1
( )

2
I
i i
i
y y
I
o
=

=

1.72
2
2
2
1
1 1 ( )
( )
o
o
y I
i
i
y y
w
K I
y y
=

= + +

1.73

( , )

o
o
y y
w
o |
o

A = 1.74

Tefilo, R. F. 74
O LOD ser determinada com y
o
= 0 e e o | sero as probabilidades de falso
positivo e falso negativo, respectivamente.
Esta extenso baseada na idia de que o LOD no varia com a transformao
linear na varivel independente. Assim, o LOD poder ser estimado de acordo com
a IUPAC e a norma ISO, por meio da regresso entre as concentraes estimadas
pelos modelos multivariados (bilinear e trilinear PLS) vs. os valores padres.
Mtodo de Boqu e Rius
A seguinte equao resume a reformulao do LOD de Boqu e Rius (1997)
[112] tambm divulgada por Lorber (1997) [87] para modelos de calibrao
multivariada inversa:
LOD ( , ) r o | = A 1.75
em que r uma estimativa do desvio padro dos rudos. Aqui ser empregada a
mdia dos desvios padres de cada coluna da matriz de rudos.
Mtodo proposto
O mtodo de Clayton et al. (1987) [109] infelizmente apresenta uma falha
quando o modelo construdo longe da regio do limite de deteco. A falha ocorre
no clculo de w
x
que atinge altos valores para modelos longe do LOD. Aqui ser
proposta uma correo para esta falha que se baseia em um dos mtodos proposto
pela IUPAC para o clculo do LOD que utiliza o modelo de regresso conforme a
seguinte equao [113]:
(3 )
LOD

a
a
b
o +
= 1.76
em que o intercepto na equao de regresso e

b o coeficiente de regresso e

a
o erro relacionado ao intercepto, calculado a partir de repeties. A proposta
apresentada aqui consiste em realizar a estimativa do erro no intercepto usando o
clculo da matriz de varincia e covarincia (equao 1.21) considerando os
valores estimados como varivel independente no modelo de regresso. O
intercepto estimado com uma coluna de uns, adicionada ao lado esquerda dos
valores estimados. O valor do desvio padro s substitudo na equao 1.21 pelo

Tefilo, R. F. 75
valor de (,). A varincia do intercepto calculada atravs da equao 1.22 com
i = 1 e ser definida aqui como e
a
.
Assim, na equao 1.76, o termo 3
a
ser substitudo pelo termo e
a
o que
fornece a seguinte proposta para o clculo do limite de deteco para modelos de
calibrao multivariada inversa:

LOD

a
a e
b
+
= 1.77
Este mtodo ser comparado aos outros descritos, na parte de aplicaes desta
tese.
Mtodos Quimiomtricos de Ordem Superior
Quando para cada amostra uma determinada varivel (varivel 2 na Figura
1.18) investigada em toda sua extenso de nveis desejados, dentro de cada nvel
de outra varivel (varivel 1 na Figura 1.18), que tambm investigada em toda
sua extenso, obtm-se como resposta uma matriz de dados. Os mtodos de ordem
superior ou multimodos so aqueles que trabalham este tipo de dado.

Figura 1.18. Representao esquemtica da obteno de uma matriz de dados com
informaes analticas para uma amostra, apta a ser tratada com mtodos multimodo.
Os ento chamados mtodos hifenados, como por exemplo,
espectroeletroqumica, cromatografia gasosa com deteco por espectrometria de

Tefilo, R. F. 76
massas (CG-MS), cromatografia lquida de alta eficincia com deteco
ultravioleta (UV) por arranjo de diodos (HPLC-DAD), etc, so fonte de dados para
os mtodos multimodos. Outras tcnicas aptas a fornecerem este tipo de dado so a
espectroscopia de fluorescncia, em que para cada comprimento de onda de
excitao obtm-se o espectro de emisso, as chamadas matrizes excitao/emisso
(EEM) alm das tcnicas invasivas, como por exemplo, obter voltamogramas ou
espectros em diferentes valores de pH.
Os mtodos multimodos tiveram sua origem com o trabalho do psicometrista
Cattell (1944) [114], que introduziu o conceito de perfis proporcionais paralelos,
seguido dos trabalhos de Tucker (1963 e 1966) [115,116] e dos trabalhos
apresentados independentemente pelos psicometristas Harshman (1970) [117] e
Carroll (1970) [118], que introduziram, respectivamente, os mtodos: Anlise dos
Fatores Paralelos (PARAFAC) e Decomposio Cannica (CANDECOMP),
ambos com o mesmo conceito.
Em qumica, esta rea surgiu com os trabalhos apresentados por Ho et al., que
datam de 1978 [119,120] e focavam o uso da anulao de posto. Outros mtodos
como o de Tucker e PARAFAC foram introduzidos na qumica entre meados dos
anos 80 e incio dos 90 [121-125].
Diversos mtodos de ordem superior foram propostos e outros, modificados.
Dentre estes mtodos, o PARAFAC atualmente o mais atraente [126] e tem sido
amplamente aplicado em diversas reas da qumica [127-130].
Em qumica analtica principalmente, um mtodo que tem sido aplicado
juntamente com o PARAFAC a verso multimodo para PLS, conhecido tambm
como PLS multilinear ou N-PLS [131-134]. Este mtodo de regresso foi
apresentado e bem divulgado por Bro (1996) [32], mas um mtodo semelhante j
havia sido proposto anteriormente por Sthle (1989) [135]. O N-PLS utiliza a
informao multimodo dos dados, ao contrrio do PLS com os dados multimodos
matriciados (desdobrados), o M-PLS. Teoricamente [32], o N-PLS apresenta
desempenho superior ao M-PLS e seu vetor de regresso traz informaes
interpretativas de ambos os modos.
Nesta tese estes dois mtodos sero aplicados sobre espectros EEM, obtidos
durante a eletrlise de misturas de compostos fenlicos no eletrodo de diamante

Tefilo, R. F. 77
dopado com boro para realizar a previso da degradao individual de cada
composto na mistura, assim, os dois sero descritos com mais detalhes a seguir.
- PARAFAC
O mtodo PARAFAC um mtodo de decomposio, que pode ser
comparado ao PCA, porm a decomposio do PARAFAC realizada em trades
ou componentes trilineares. Ao invs de um vetor de escore e um vetor de loadings
como em PCA, cada componente no PARAFAC consiste de um vetor de escores e
dois vetores de loadings. comum na prtica da anlise multimodos no fazer
distino entre escores e loadings, visto que so tratados igualmente em termos
numricos. Aqui o modo das amostras ser tratado como escores.
A importante diferena entre o PCA e o PARAFAC que no PARAFAC no
h necessidade de exigir ortogonalidade para identificar o modelo.
A Figura 1.19 mostra a diferena estrutural dos mtodos PCA e PARAFAC,
considerando o PCA como a decomposio dos valores singulares (SVD).

Figura 1.19. Extenso da decomposio SVD para a decomposio PARAFAC. Na
decomposio SVD (ver apndice), as matrizes A
svd
e P so obrigatoriamente
ortogonais. O modelo PARAFAC no seqencial e a soluo nica (no h
liberdade rotacional). O PARAFAC um caso especial do modelo Tucker3, onde o

Tefilo, R. F. 78
nmero de componentes em cada modo igual e a matriz ncleo G que
superdiagonal e unitria.
A diferenciao entre a matriz A
svd
e a matriz A
parafac
mostrada na Figura 1.19
usando um subscrito, foi realizada aqui para evitar confuses e isto ser feito
quando necessrio, porm, em todo texto a distino no ser explicitamente
realizada uma vez que o prprio modelo define a matriz A.
Formalmente o modelo PARAFAC dado pela seguinte equao:
1
h
ijk ih jh kh ijk
i
x a b c e
=
= +

1.78
em que a
ih
, o elemento da matriz de escore do modo A(I x h) e b
jh
e c
kh
so os
elementos das matrizes de loadings dos modos B(J x h) e C(K x h),
respectivamente e e
ijk
o elemento da matriz de resduos. A, B e C so escolhidas
de maneira a minimizar a soma quadrtica dos resduos. Assim, o modelo
PARAFAC em termos matriciais apresentado da seguinte maneira:
t

( )
IxJK
= X A C B 1.79
O smbolo o produto Khatri-Rao (Apndice)
Entretanto, outra maneira de representar o modelo PARAFAC atravs da
representao do modelo Tucker3 restrito (no apresentados aqui).
t

( )
IxJK
= X AG C B 1.80
em que G(h x hh) o ncleo do arranjo (Figura 1.19) e o smbolo o produto
Kronecker (Apndice). A matriz G idealmente para o modelo PARAFAC, um
arranjo binrio com zeros em todos os lugares exceto em sua superdiagonal, que
contm apenas uns.
As caractersticas do modelo PARAFAC so: (1) o modelo trilinear; (2) o
nmero de componentes h so iguais em todos os modos; (3) o modelo no
seqencial i.e. h a necessidade de reestimar completamente o modelo quando um
diferente nmero de componentes desejado; (4) no h interao permitida entre
as componentes dos diferentes modos i.e. as informaes nas componente so
independentes; (5) a matriz ncleo G, (Figura 1.19) uma matriz identidade i.e.
com uns em sua superdiagonal principal. Na equao 1.76 estes elementos so

Tefilo, R. F. 79
armazenados em c; (6) cada componente dos modos podem ser obtidos de tal
maneira que eles no sejam necessariamente ortogonais; (7) a soluo dependente
da rotao. A realizao de rotao destri a soma quadrtica mnima da soluo
tima. Consequentemente a soluo nica; (8) a soluo por ser nica pode ser
interpretada.
Estas caractersticas mostram que, apesar de ser equivalente ao PCA para
dados bilineares, o PARAFAC diferente para dados trilineares e apresenta
caractersticas superiores em relao ao PCA, principalmente devido a sua
unicidade de soluo.
No modelo PCA h liberdade rotacional, o que considerado um problema
para os quimiometristas. Os loadings no modelo PCA refletem os sinais puros dos
analitos medidos, mas no possvel sem uma informao externa encontrar os
sinais puros devido ao problema de rotao. Este problema no ocorre no modelo
PARAFAC. Na maioria das circunstncias o modelo tem identidade nica da
estrutura dos dados e consequentemente nenhum tratamento posterior necessrio
quando modelo o melhor em termos de problemas de quadrados mnimos. Se os
dados so aproximadamente trilineares, o verdadeiro fenmeno essencial ser
encontrado se o nmero correto de componentes for usado e a razo sinal rudo for
apropriada [136].
A unicidade do PARAFAC tem sido amplamente explorada em qumica
analtica [93,137-139] e chamada vantagem de segunda ordem. Isto ocorre, pois,
em uma decomposio nica possvel obter os perfis puros dos sinais em ambos
os modos. Um dos perfis em qumica analtica est correlacionado s amostras e,
portanto, s concentraes dos analitos na amostra. As concentraes para cada
componente na amostra podem ser extradas diretamente, mesmo na presena de
componentes no calibrados [93]. Logicamente, para cada interferente a mais na
amostra, mais componentes sero necessrios para ajustar o modelo.
- Algoritmos para ajustar o modelo PARAFAC
Em termos computacionais o ajuste do modelo PARAFAC tem se restringido
a duas classes de algoritmos: aqueles que empregam os quadrados mnimos
alternantes (ALS) [117,118,136] que iterativo, e aqueles que usam o

Tefilo, R. F. 80
procedimento direto baseado na resoluo dos problemas de autovalores
generalizado [126] e.g. mtodo de anulao de posto generalizado (GRAM) [140]
ou decomposio trilinear direta (DTLD) [141].
Vrios outros mtodos tm sido testados, mas apenas alguns poucos
conseguiram atingir o excelente desempenho do PARAFAC-ALS [142,143].
Porm, o desempenho de cada mtodo influenciado por vrios aspectos que
pertencem aos dados e no somente ao algoritmo por si s [126].
Consequentemente, fatores como desvio de posto, colinearidade entre
componentes, pr-tratamentos adequados, quantidade e tipo de rudos e presena e
padres de valores faltantes, desempenham um papel importante na escolha de qual
algoritmo deve ser usado [143].
Porm, a escolha de um algoritmo adequado muito complicada se for
considerado que outro critrio diferente do ALS possa ser mais apropriado para um
especfico tipo de dado. Alm disso, se os dados necessitarem de restries, outros
mtodos no so adequados, alm do ALS.
Portanto, na maioria dos casos o algoritmo ALS resolve o problema, sendo,
porm muito lento para dados com dificuldade de ajuste.
O ALS um mtodo antigo proposto por Yates (1933) [144], e conhecido no
campo da matemtica aplicada computao como algoritmo no linear de Gauss-
Seidel [126].
O problema no linear representado pelo ajuste do modelo PARAFAC
dividido em pequenos problemas lineares que so resolvidos iterativamente. Em
cada etapa, um subconjunto dos parmetros do modelo estimado
condicionalmente ao restante e uma iterao simples completada quando todos os
sub-problemas forem resolvidos. Consequentemente, cada completa iterao
consiste de um nmero de sub-etapas que dependem do particionamento dos
parmetros do modelo.






Tefilo, R. F. 81

O algoritmo PARAFAC-ALS consiste das seguintes etapas [136]
Defina o critrio de convergncia:
Inicialize B e C
t
1. ( )
( )
IxJK
+
=
=
Z C B
A X Z Z Z

t
2. =( )
( )
JxIK
+
=
Z C A
B X Z Z Z

t
3. =( )
( )
KxIJ
+
=
Z B A
C X Z Z Z

2
t
1
1
4. Calcule o critrio de convergncia:
= ( )
5. , retorne etapa 1
iter iter
IxJK
iter
SQR SQR
SQR e
SQR
Se
o
o c

=
>
X A C B
Uma boa inicializao do algoritmo pode ajudar no desempenho final e
tambm ajuda a assegurar que o mnimo global do modelo seja encontrado [136].
Normalmente a inicializao realizada com o auxlio de mtodos diretos, como o
DTLD por exemplo.
Algumas vantagens do ALS so: (1) simplicidade; (2) pode ser estendido para
n modos; (3) pode manipular dados faltantes; (4) pode ser adaptado para aceitar
restries tais como no negatividade; unimodalidade; ortonormalidade; etc.
- Validao de modelos PARAFAC
Como bem descrito por Smilde et al. (2004) [27], a anlise dos dados
frequentemente baseada na avaliao de modelos ajustados. Estes modelos
fornecem aproximaes e interpolaes do sistema real em estudo. H
frequentemente uma ampla escolha de modelos e a qualidade destes depende
tambm de certo nmero de fatores, pois modelos matemticos e estatsticos
baseados em dados reais tm propriedades que dependem no apenas do sistema
em estudo, mas tambm da amostragem, das propriedades do modelo, dos
algoritmos etc.

Tefilo, R. F. 82
Uma importante parte da validao usar de diagnsticos para caracterizar a
qualidade da soluo. Nesta tese as ferramentas diagnsticas empregadas para
validar o modelo foram aquelas baseadas em muitos ajustes usando apenas um
conjunto ou mltiplos conjuntos de dados.
Escolha do nmero de componentes
Uma maneira de escolher o nmero correto de componentes iniciar (repetir)
o ajuste para o modelo PARAFAC de diferentes estratgias, como por exemplo,
usando as decomposies DTLD, SVD e a inicializao aleatria. Para cada
inicializao e para cada componente calculam-se parmetros para o modelo que
descreva a sua qualidade como, por exemplo, usando a soma quadrtica residual, o
nmero de iteraes para atingir o ajuste e a percentagem de consistncia do ncleo
(CORCONDIA) [145]. Ao plotar os valores para cada um dos parmetro obtidos de
diferentes inicializaes e para cada componente, possvel concluir com boa
preciso quantas componentes so necessrias para ajustar o modelo PARAFAC
observando o comportamento destes valores no grfico simultaneamente.
Para analisar a soma quadrtica residual, podemos considerar que um
inesperado aumento no nmero de mnimos locais seja uma forte indicao que o
rudo est sendo modelado e que as variaes para um mesmo nmero de
componentes possam ser observadas i.e. as repeties usando diferentes
inicializaes no so idnticas. Para este caso, um nmero timo de componentes
aquele que tem a soma quadrtica residual pequena e que se repita para as
diferentes inicializaes.
J, um aumento inesperado no nmero de iteraes necessrias, sugere que
muitas componentes esto sendo usadas, mas tambm pode indicar um difcil
problema, por exemplo, falta de trilinearidade, grande quantidade de dados
faltantes, baixa relao sinal/rudo, entre outros. Espera-se que o nmero timo
acontea antes de uma variao brusca no nmero de iteraes para uma prxima
componente.
A ferramenta diagnstica CORCONDIA um parmetro diagnstico que
pode ser obtido com bastante rapidez para determinar o nmero correto de
componentes, mas no pode ser aplicado sozinho [145].

Tefilo, R. F. 83
Para entender o princpio do CORCONDIA, considere as equaes 1.79 e 1.80
Se o ncleo do arranjo, representado por G, no estiver consistente com o modelo
PARAFAC, o modelo no estar bem ajustado. Sabe-se que o ncleo do modelo
Tucker3 definido por T, ser idntico ao ncleo G (superdiagonal binrio) se o
modelo PARAFAC estiver perfeitamente ajustado. O modelo Tucker3 por
definio a representao tima do arranjo dos dados em relao ao subespao
definido pelos componentes, enquanto que o modelo PARAFAC especificamente
desconsidera qualquer variao associada com os elementos fora da superdiagonal,
visto que so igualados a zero. Portanto, se os elementos da superdiagonal de G
estiverem prximos aos seus elementos correspondentes em T e os elementos fora
da superdiagonal so todos prximos de zero, o modelo apropriado. Portanto, o
CORCONDIA trata-se de um mtodo de comparao entre os elementos de T e de
G. Uma maneira de quantificar estas similaridades atravs da equao 1.81.
2
1 1 1
( )
CORCONDIA 100 1
h h h
def def
d e f
t g
h
= = =
| |

|
= |
|
|
\ .

1.81
em que t so os elementos de T e g so os elementos de G.
Assim, se o modelo PARAFAC vlido ento o CORCONDIA estar muito
prximo de 100%. Se os dados no podem ser descritos por um modelo trilinear ou
se muitas componentes esto sendo usadas, o CORCONDIA ter com valores
prximos de zero ou mesmo negativos. Se a consistncia estiver com valor prximo
de 50% o modelo instvel.
Entretanto, Bro (1998) [146] fez a seguinte importante considerao: o
CORCONDIA apenas uma ferramenta. Ele no prova nada. Ele baseado em
algumas suposies e pode como qualquer outra ferramenta ser enganosa. Ento
no recomendvel propor um modelo usando apenas a consistncia do ncleo
como uma alegao persuasiva. recomendo o uso de vrias ferramentas e
visualizaes para provar realmente que o modelo est ajustado com o nmero
correto de componentes.

Tefilo, R. F. 84
Analisando o modelo ajustado
Duas outras ferramentas diagnsticas que podem e devem ser empregadas
para analisar o modelo ajustado com h componentes so as tcnicas split-half e
Jack-knife.
Alguns pesquisadores como R.A. Harshman [147] e R. Bro [136] defendem
que o uso da anlise split-half uma das melhores maneiras de determinar se o
posto qumico do modelo PARAFAC est adequado e tambm, verificar se o
modelo est corretamente ajustado.
Na anlise split-half diferentes subconjuntos dos dados so analisados
independentemente (Figura 1.20). Devido unicidade do modelo PARAFAC, se o
nmero correto de componentes foi escolhido, os mesmos resultados mesmos
loadings devero ser obtidos para cada subconjunto e entre os subconjuntos e o
modelo completo. Se um nmero maior ou menor de componentes escolhido em
relao ao nmero timo, os parmetros dos modelos construdos para cada
subconjunto diferiro entre si e, portanto, os loadings sero diferentes.

Figura 1.20. Partio de I amostras na anlise split-half. As amostras so divididas em
dois grupos A e B que so separados e divididas posteriormente em dois outros grupos,
C e D, que tambm so separados.
Para julgar se os modelos so iguais, a indeterminao em modelos multilinear
tem que ser respeitada. A ordem e escala dos loadings podem mudar se o algoritmo
no for fixado. Se um modelo estvel na anlise split-half uma clara indicao
que o modelo real, i.e., o modelo captura a variao essencial, que no pertence
apenas a algumas amostras especficas. Se, por outro lado alguns componentes no
so estveis em uma anlise split-half, um indicativo que eles refletem o rudo ou
que poucas componentes foram extradas. Como conseqncia o modelo no
vlido. Pode acontecer de alguns subconjuntos no serem estveis. Isto pode
indicar a presena de possveis amostras anmalas nos subconjuntos. Portanto,

Tefilo, R. F. 85
instabilidade em uma anlise split-half no sempre conclusiva, como acontece
com a estabilidade.
Recentemente, Riu e Bro [148] mostraram, usando uma estratgia muito
similar anlise split-half conhecida como Jack-knife, que tambm possvel
estimar erros relacionados aos parmetros e detectar amostras anmalas em
modelos PARAFAC. Aplicando a tcnica jack-knife para o modelo PARAFAC
para um conjunto de I amostras, I submodelos PARAFAC so obtidos. Os
submodelos so comparados entre si e com o modelo completo e assim pode-se
verificar se h ou no amostras anmalas.
Cada um dos I submodelos (dado pelos parmetros , e
m m m
A B C em que o
subscrito m significa que o modelo foi obtido deixando fora uma amostra m) tem
a ele associado indeterminaes de escala e de permutao que so removidas antes
da estimativa jack-knife para ser diretamente comparado com os outros
submodelos. Os detalhes da remoo destas indeterminaes so bem descritas no
trabalho de Riu e Bro (2003) [148].
Para detectar amostras anmalas e observar o comportamento dos modelos a
partir dos resultados da anlise jack-knife, dois grficos so recomendados a serem
observados: o grfico de influncia de reamostragem (RIP) e o grfico da
identidade emparelhada (IMP) [148].
No grfico RIP, a soma dos quadrados dos resduos da m-sima amostra para
o modelo calculado na m-sima iterao jack-knife mostrada em um dos eixos
versus a soma dos quadrados da diferena entre os loadings (segundo e terceiro
modo) obtido com cada segmento jack-knife e com o modelo PARAFAC com
todas as amostras. Por exemplo, para o segundo modo (J) e o m-simo segmento
jack-knife, a soma dos quadrados da diferena entre os loadings (b) para h
componentes dada por:
2
, ,
1 1
( )
h J
completo ji m ji
i j
b b

= =

1.82
O grfico RIP pode ser interpretado olhando as amostras que tem altos
resduos e/ou altas diferenas entre loadings calculados com ou sem a amostra. Este

Tefilo, R. F. 86
grfico ajuda a detectar amostras que diferem mais da populao completa em
relao ao modelo PARAFAC.
No grfico IMP, em um dos eixos esto os escores obtidos com o modelo
completo, A
completo
e no outro eixo os escores previstos para a m-sima amostra
usando o modelo PARAFAC obtido na m-sima iterao (i.e. o modelo obtido
deixando fora a m-sima amostra), A
previsto,m.
Os escores previstos para as m-simas
amostras so encontrados usando a seguinte expresso:
t
previsto,
(( ) )
m m m m
+

= A x C B 1.83
em que x
m
corresponde ao dado experimental vetorizado para a m-sima amostra.
No grfico IMP para cada analito, a amostra anmala ser aquela que estiver longe
da linha de identidade ideal.
Todos os mtodos de validao descritos acima foram aplicados e os
resultados so apresentados no Captulo 7.
- N-PLS, o PLS Multilinear
Diferentes mtodos podem ser empregados para realizar a calibrao
multivariada PLS ou PCR usando dados de ordem superior. Um deles fazer a
matriciao dos dados e construir o modelo PLS ou PCR normalmente,
considerando os dados como de primeira ordem. Outra possibilidade usar, por
exemplo, o mtodo PARAFAC para decompor o arranjo e ento,
subsequentemente, realizar a regresso PLS ou PCR da varivel dependente sobre
os escores, i.e. o modo das amostras. Entretanto, nenhum destes mtodos utiliza o
arranjo trilinear como um todo (senso trilinear) para extrair a informao necessria
para a calibrao. Porm, Sthle (1989) [135] e posteriormente Bro (1996) [32],
apresentaram uma metodologia que considera esta possvel vantagem, estendendo
diretamente para N-modos a regresso PLS aplicada em dois modos, o ento
conhecido N-PLS.
Apesar de o algoritmo de Sthle (1989) [135] ser baseado na decomposio
linear em trs modos (LTD) aplicando a aproximao ALS, diferente do algoritmo
de Bro (1996), ambos guiam para um modelo de calibrao equivalente e fornecem
as mesmas previses [36]. O Algoritmo de Sthle (1989), porm, fornece um

Tefilo, R. F. 87
modelo complicado de se interpretar visto que o modelo torna-se um modelo como
se os dados estivessem matriciados [27]. Apesar de atingirem os mesmos
resultados, o algoritmo proposto por Bro (1996) apresenta algumas vantagens
como: (1) o critrio de otimizao explicito; (2) numericamente mais confivel;
(3) usualmente mais rpido [36].
A principal caracterstica do mtodo de Bro (1996) [32] que ele produz
vetores de escores que em um senso trilinear apresenta a mxima covarincia com a
parte da varivel dependente no explicada. A soluo fcil de explicar
comparada com os mtodos que realizam a matriciao. Isto especialmente
importante quando o nmero de variveis alto. O algoritmo rpido devido ao
nmero de parmetros a serem estimados, que menor e ao fato de que ele se
resume a problemas de autovalores [32]. H, porm uma perda no ajuste em relao
aos modelos bilineares, devido s restries mais severas [136] e tambm h perda
da vantagem de segunda ordem, visto que as componentes so extradas via
decomposio SVD e, portanto, so seqenciais e o modelo no nico.
O algoritmo proposto por Bro(1996) [32] foi comentado por Smilde (1997)
[149], que apresentou as equaes para as etapas de previso. Em 1998, de Jong
[36] divulgou o algoritmo completo levemente modificado, em linguagem
Matlab. Entretanto, o algoritmo mostrado por de Jong apresenta vrios erros e
aqui apresentado o algoritmo N-PLS corrigido por Martins [150].
1.
e
= y y , inicialize a varivel dependente;
Para cada componente:
2.
IxJK IxJxK
X X , matriciao nos modos JK (variveis independentes);
3.
t
1xJK e
= c y X, vetor de covarincia;
4.
1 JxK xJK
Z c , vetor de covarincia convertido para matriz;
5. [ , , ] svd( ) j k w s w Z , decomposio SVD (Apndice). Gera os pesos dos
modos J e K (usa-se apenas a primeira componente);
6. ( ) k j = T X w w , clculo dos escores;
7.
t 1 t
( )

= b T T T y , relaciona os escores varivel dependente y.


8.
e
= y y Tb, calcula o resduo de y.
Para cada componente:
9.
npls
( ) k j = b w w b, coeficiente de regresso

Tefilo, R. F. 88
Observe que o algoritmo no trabalha diretamente no tensor de segunda
ordem, mas na sua forma matriciada e por isso usa a decomposio SVD.
Uma importante diferena do algoritmo N-PLS em relao ao PLS bilinear
que o clculo da relao dos escores varivel dependente, b, realizado em cada
etapa, no importando o nmero de componentes a serem calculados. Esta
limitao uma conseqncia da no ortogonalidade das componentes no
algoritmo, ao contrrio do PLS convencional [26].
Em relao construo e validao do modelo de calibrao usando o
mtodo N-PLS, basicamente os mesmos procedimentos j descritos nesta tese para
PLS podem ser empregados, porm o algoritmo N-PLS apresenta a seguinte
modificao aps a etapa 8:
Para 1 at o nmero de componentes atual
9. ( )
NPLS NPLS
k j = + b b w w b
Finaliza o lao interno
10.
npls npls
[ ]
NPLS
= B B b
Finaliza o lao externo

Com esta modificao no algoritmo N-PLS, o vetor de regresso atualizado
para cada uma das componentes desejadas e assim pode ser usado em um algoritmo
de validao cruzada. O algoritmo anterior, diferentemente, calcula o vetor de
regresso apenas para a ltima componente.
- Seleo de variveis em dados de segunda ordem
Dados multimodos, normalmente, so arranjos de um grande conjunto de
dados, pois se trata de uma coleo de matrizes. Para processar tais informaes, os
algoritmos tendem a consumir muito tempo computacional e o custo da anlise se
torna alto e s vezes invivel computacionalmente. Alm disso, dependendo da
anlise empregada, o modelo torna-se difcil de ser interpretado e muitas vezes, por
processar variveis no relevantes pode apresentar baixa capacidade de previso.
Uma maneira de resolver estes problemas selecionar as variveis que
realmente so importantes e assim: (1) diminuir o tamanho do conjunto de dados e

Tefilo, R. F. 89
minimizar o tempo e custo computacional; (2) aumentar ou manter o poder de
previso e; (3) a partir das variveis selecionadas, tornar o modelo interpretvel.
Seleo de variveis em dados multimodos um campo de pesquisa muito
recente dentro da quimiometria. At o presente momento, h apenas quatro
trabalhos que utilizaram seleo de variveis em dados multimodos [151-154] e
todos eles empregaram o algoritmo gentico como selecionador de variveis. O
mtodo proposto aqui portanto o primeiro que usa uma estratgia diferente do GA
para selecionar variveis em dados multimodos.
O mtodo de seleo das variveis ordenadas (OPS

) proposto por Tefilo et


al. (2006) [155,156] para dados em dois modos, ser empregada aqui como uma
extenso para dados em trs modos e ser denominado nOPS. A estratgia deste
algoritmo obter o vetor de regresso do modelo N-PLS, organizar este vetor em
uma matriz (matriz de regresso) com I linhas e J colunas, em que cada linha
relacionada s matrizes de um dos modos e cada coluna est relacionada a cada
varivel do mesmo modo. Assim, um vetor obtido para cada matriz de um dos
modos. A transposta da matriz de regresso relacionada com o outro modo das
variveis (Figuras 1.21).

Figura 1.21. Primeira etapa do algoritmo nOPS: Ordenando as variveis.
Considera-se aqui que cada linha da matriz de regresso e combinaes destas
linhas com outros vetores obtidos para cada matriz, traz informaes das variveis
mais importantes nas suas respectivas matrizes no tensor de dados. Posteriormente

Tefilo, R. F. 90
estes vetores so usados como entrada no algoritmo OPS

, que aplicado sobre


cada matriz no tensor usando seu respectivo vetor (Figura 1.21).
Os conjuntos das variveis selecionadas em cada matriz do tensor so
armazenados e cada conjunto repetido R vezes, de acordo com seus resultados
estatsticos. Uma contagem das variveis usadas em todos os conjuntos realizada
e o vetor com as variveis usadas decrescentemente ordenado de acordo com seu
nmero de repeties (Figura 1.22).

Figura 1.22. Segunda etapa do algoritmo nOPS: Obtendo o vetor prognstico.
Este ltimo vetor usado como vetor informativo e empregado como no
mtodo OPS

para ordenar as variveis. Aqui, o algoritmo empregado para analisar


a janela e os incrementos das variveis o N-PLS (Figura 1.23).
Na janela e em cada janela com incrementos adicionados, obtm-se
parmetros tais como RMSECV e r
cv
, que so usados para decidir qual conjunto de
varivel apresenta maior capacidade de previso.

Tefilo, R. F. 91

Figura 1.23. Terceira etapa do algoritmo nOPS: Investigao das variveis ordenadas
no tensor.
Aps a seleo das variveis em um dos modos, pode ser realizado a seleo
das variveis do outro modo sobre o conjunto j selecionado, ou sobre o conjunto
completo. Portanto, as variveis no so obrigatoriamente selecionadas em ambos
os modos, o que pode ser uma vantagem em casos especficos. Esta propriedade do
nOPS difere do mtodo GA para selecionar variveis em dados multimodos, visto
que ao usar o GA, obrigatoriamente seleciona-se variveis em ambos os modos,
simultaneamente.
Referncias
1. Ferreira, M. M. C.; Antunes, A. M.; Melgo, M. S.; Volpe, P. L. O. Chemometrics I:
Multivariate calibration, a tutorial. Quim. Nova 1999, 22, (5), 724-731.
2. Winefordner, J. D. Chemometrics: From basics to wavelet transform. John Wiley &
Sons Inc: New Jersey, 2004; Vol. 164, p 292.
3. Bro, R. Review on multiway analysis in chemistry - 2000-2005. Crit. Rev. Anal. Chem.
2006, 36, (3-4), 279-293.
4. Kiers, H. Towards a standardized notation and terminology in multiway analysis. J.
Chemometr. 2000, 14, (3), 105-122.
5. Chau, F. T.; Liang, Y. Z.; Gao, J.; Shao, X. G. Chemometrics: From Basics to Wavelet
Transform. In Chemical analysis, 1 ed.; Winefordner, J. D., Ed. John Wiley &
Sons Inc: New Jersey, 2004, Vol. 164.

Tefilo, R. F. 92
6. Brereton, R. G. Chemometrics: Data Analysis for the laboratory and chemical plant.
John Wiley & Sons Inc: Chinchester, 2003; p 407.
7. Eco Chemie, B. V. General purpose electrochemical system (GPES) for windows,
4.9.004; Eco Chemie: Utrecht, 2002.
8. Montgomery, D. C.; Runger, G. C. Applied Statistics and Probability for Engineers.
3nd ed.; John Wiley & Sons Inc: New York, 2003; p 703.
9. Lundstedt, T.; E., S.; Abramo, L.; Thelin, B.; Nystrm, A.; Pettersen, J.; Bergman, R.
Experimental design and optimization. Chemometrics Intell. Lab. Syst. 1998, 42, 3-
40.
10. Neto, B. B.; Scarminio, I. S.; Bruns, R. E. Como fazer experimentos: pesquisa e
desenvolvimento na cincia e na indstria. Editora Unicamp: Campinas, 2001; p
401.
11. Box, G. E. P.; Hunter, W. G.; Hunter, J. S. Statistic for Experimenters: An
Introduction to Design, Data Analysis and Model Building. 1 ed.; John Wiley &
Sons Inc: New York, 1978.
12. Plackett, R. L.; Burman, J. P. The design of optimum multifactorial experiments.
Biometrika 1946, 33, (4), 305-325.
13. Morgan, E.; Burton, K. W.; Church, P. A. Pratical Exploratory Experimenatl Designs.
Chemometrics Intell. Lab. Syst. 1989, 5, 283-302.
14. Myers, R. H.; Montgomery, D. C. Response Surface Methodology. John Wiley &
Sons Inc: New York, 2002.
15. Box, G. E. P.; Draper, N. R. Empirical Moodel-Building and Response Surfaces. 1
ed.; John Wiley & Sons Inc: New York, 1987.
16. Christensen, R. Analysis of Variance, design and regression. CRC Press Inc: New
York, 2000.
17. Box, G. E. P.; Wilson, K. B. On the experimental attainment of optimum conditions.
J. Roy. Statist. Soc., Ser. B13 1951, 1-38.
18. Doehlert, D. H. Uniform shell designs. Appl. Stat. 1970, 19, 231-239.
19. Ferreira, S.; dos Santos, W.; Quintella, C. M.; Neto, B. B.; Bosque-Sendra, J. A.
Doehlert matrix: a chemometric tool for analytical chemistry - review. Talanta
2004, 63, (4), 1061-1067.
20. Massart, D. L.; Vandeginste, B. G. M.; Buydens, L. M. C.; de Jong, S.; Lewi, P. J.;
Verbeke-Smeyers, J. Handbook of Chemometrics and Qualimetrics. Elsevier:
Amsterdam, 1998; Vol. Part A.
21. Martens, H.; Naes, T. Multivariate Calibration. John Wiley & Sons: New York, 1989;
p 419.

Tefilo, R. F. 93
22. Phatak, A. Evaluation of some multivariate methods and their applications in
chemical engineering. University of Waterloo, Ontario, 1993.
23. Golub, G. H.; Van Loan, C. F. Matrix computation. 2nd ed.; Johns Hopkins
University Press: Baltimore, 1989.
24. Beebe, K. R.; Pell, R. J.; Seasholtz, M. B. Chemometrics: A pratical guide. 1 ed.; John
Wiley & Sons Inc: New York, 1998; p 348.
25. Wold, S.; Esbensen, K.; Geladi, P. Principal component analysis. Chemometrics
Intell. Lab. Syst. 1987, 2, (1-3), 37-52.
26. Brereton, R. G. Introduction to multivariate calibration in analytical chemistry.
Analyst 2000, 125, (11), 2125-2154.
27. Smilde, A.; Bro, R.; Geladi, P. Multi-way analysis with applications in the chemical
science. 1 ed.; John Wiley & Sons Inc: Chinchester, 2004; p 379.
28. Escandar, G. M.; Damiani, P. C.; Goicoechea, H. C.; Olivieri, A. C. A review of
multivariate calibration methods applied to biomedical analysis. Microchem J.
2006, 82, (1), 29-42.
29. Bro, R. Multivariate calibration - What is in chemometrics for the analytical chemist?
Anal. Chim. Acta 2003, 500, (1-2), 185-194.
30. Naes, T.; Isaksson, T.; Fearn, T.; Davies, T. Multivariate calibration and
classification. Nir publications: Chinchester, 2002; p 344.
31. Geladi, P.; Kowalski, B. R. Partial least-squares regression - a tutorial. Anal. Chim.
Acta 1986, 185, 1-17.
32. Bro, R. Multiway calibration. Multilinear PLS. J. Chemometr. 1996, 10, (1), 47-61.
33. Andersen, C. M.; Bro, R. Practical aspects of PARAFAC modeling of fluorescence
excitation-emission data. J. Chemometr. 2003, 17, (4), 200-215.
34. Bro, R. PARAFAC. Tutorial and applications. Chemometrics Intell. Lab. Syst. 1997,
38, (2), 149-171.
35. Phatak, A.; de Hoog, F. Exploiting the connection between PLS, Lanczos methods
and conjugate gradients: alternative proofs of some properties of PLS. J.
Chemometr. 2002, 16, (7), 361-367.
36. De Jong, S. Regression coefficients in multilinear PLS. J. Chemometr. 1998, 12, (1),
77-81.
37. Helland, I. S. Some theoretical aspects of partial least squares regression.
Chemometrics Intell. Lab. Syst. 2001, 58, (2), 97-107.
38. Phatak, A.; De Jong, S. The geometry of partial least squares. J. Chemometr. 1997,
11, (4), 311-338.

Tefilo, R. F. 94
39. Elden, L. Partial least-squares vs. Lanczos bidiagonalization - I: analysis of a
projection method for multiple regression. Comput. Stat. Data Anal. 2004, 46, (1),
11-31.
40. Manne, R. Analysis of 2 partial-least-squares algorithms for multivariate calibration.
Chemometrics Intell. Lab. Syst. 1987, 2, (1-3), 187-197.
41. Barker, M.; Rayens, W. Partial least squares for discrimination. J. Chemometr. 2003,
17, (3), 166-173.
42. Wold, H. The basic design and some extensions. In Systems under indirect
observation, G., J. K. and Wold, H., Eds. North-Holland: Amsterdam, 1982, Vol.
II, pp 1-53.
43. Wold, S.; Sjostrom, M.; Eriksson, L. PLS-regression: a basic tool of chemometrics.
Chemometrics Intell. Lab. Syst. 2001, 58, (2), 109-130.
44. Lohmller, J.-B. Latent variable path modeling with partial least squares. 1 ed.;
Physica-Verlag: Heidelberg, 1989.
45. Kowalski, B. R.; Gerlach, R. W.; Wold, H. Chemical systems under indirect
observations. In Systems under indirect observation, G., J. K. and Wold, H., Eds.
North-Holland: Amsterdam, 1982, Vol. 2, pp 191-207.
46. Geladi, P. Notes on the history and nature of partial least squares (PLS). J.
Chemometr. 1988, 2, 231-246.
47. Martens, H. Multivariate Calibration: quantitative interpretation of non-selective
chemical data. PhD thesis, Trondheim, 1985.
48. Frank, I. E.; Kalivas, J. H.; Kowalski, B. R. Partial least-squares solutions for
multicomponent analysis. Anal. Chem. 1983, 55, (11), 1800-1804.
49. Wold, S.; Martens, H.; Wold, H. The multivariate calibration problem in chemistry
solved by partial least squares. In Lecture notes in mathematics: Matrix Pencils, 1
ed.; A., R. and B., K., Eds. Springer-Verlag: Heidelberg, 1983, pp 286-283.
50. Tefilo, R. F.; Martins, J. P. A.; Ferreira, M. M. C. In Study of the computational
performance of PLS algorithms using experimental design, 10th Scandinavian
Symposium on Chemometrics, Lappeenranta, Finland, Lappeenranta, Finland,
2007, PO35.
51. Wold, S.; Ruhe, A.; Wold, H.; Dunn, W. J. The collinearity problem in linear-
regression - the partial least-squares (PLS) approach to generalized inverses. 1984,
5, (3), 735-743.
52. De Jong, S. SIMPLS - an alternative approach to partial least-squares regression.
Chemometrics Intell. Lab. Syst. 1993, 18, (3), 251-263.
53. Lindgren, F.; Geladi, P.; Wold, S. The kernel algorithm for PLS. J. Chemometr. 1993,
7, (1), 45-59.

Tefilo, R. F. 95
54. Naes, T. Multivariate calibration when the error covariance-matrix is structured.
Technometrics 1985, 27, (3), 301-311.
55. Lorber, A.; Wangen, L. E.; Kowalski, B. R. A theoretical foudation for the PLS
algorithm. J. Chemometr. 1987, 1, 19-31.
56. Helland, I. S. On the structure of partial least squares regression. Commun. Stat.-
Simul. Comput. 1988, 17, 581-607.
57. Ergon, R. PLS score-loading correspondence and a bi-orthogonal factorization. J.
Chemometr. 2002, 16, (7), 368-373.
58. Pell, R. J.; Ramos, L.; Manne, R. The model space in partial least square regression. J.
Chemometr. 2007, 21, (3-4), 165-172.
59. Golub, G. H.; Kahan, W. Calculating the singular values and pseudo-inverse of a
matrix. SIAM J. Num. Anal. Ser. B. 1965, 2, 205-224.
60. Lorber, A.; Kowalski, B. R. A note on the use of the partial least-squares method for
multivariate calibration. Appl. Spectrosc. 1988, 42, (8), 1572-1574.
61. Pirouette, T. Pirouette: Multivariate data analysis, 3.11; Infometrix: Woodinville,
2003.
62. Efron, B. Estimating the error rate of a prediction rule: Improvement on cross-
validation. J. Am. Stat. Assoc. 1983, 78, 316-331.
63. Baumann, K. Cross-validation as the objective function for variable-selection
techniques. Trac-Trends Anal. Chem. 2003, 22, (6), 395-406.
64. Xu, L.; Schechter, I. Wavelength selection for simultaneous spectroscopic analysis.
Experimental and theoretical study. Anal. Chem. 1996, 68, (14), 2392-2400.
65. Nadler, B.; Coifman, R. R. The prediction error in CLS and PLS: the importance of
feature selection prior to multivariate calibration. J. Chemometr. 2005, 19, (2),
107-118.
66. Ferreira, M. M. C. Multivariate QSAR. J. Braz. Chem. Soc. 2002, 13, (6), 742-753.
67. Jouanrimbaud, D.; Walczak, B.; Massart, D. L.; Last, I. R.; Prebble, K. A.
Comparison of multivariate methods based on latent vectors and methods based on
wavelength selection for the analysis of near-infrared spectroscopic data. Anal.
Chim. Acta 1995, 304, (3), 285-295.
68. Jiang, J. H.; Berry, R. J.; Siesler, H. W.; Ozaki, Y. Wavelength interval selection in
multicomponent spectral analysis by moving window partial least-squares
regression with applications to mid-infrared and hear-infrared spectroscopic data.
Anal. Chem. 2002, 74, (14), 3555-3565.
69. Centner, V.; Massart, D. L.; de Noord, O. E.; De Jong, S.; Vandeginste, B. M.; Sterna,
C. Elimination of uninformative variables for multivariate calibration. Anal. Chem.
1996, 68, (21), 3851-3858.

Tefilo, R. F. 96
70. Forina, M.; Lanteri, S.; Oliveros, M.; Millan, C. P. Selection of useful predictors in
multivariate calibration. Anal. Bioanal. Chem. 2004, 380, (3), 397-418.
71. Herrero, A.; Ortiz, M. C. Qualitative and quantitative aspects of the application of
genetic algorithm-based variable selection in polarography and stripping
voltammetry. Anal. Chim. Acta 1999, 378, (1-3), 245-259.
72. Chong, I. G.; Jun, C. H. Performance of some variable selection methods when
multicollinearity is present. Chemometrics Intell. Lab. Syst. 2005, 78, (1-2), 103-
112.
73. Arcos, M. J.; Alonso, C.; Ortiz, M. C. Genetic-algorithm-based potential selection in
multivariant voltammetric determination of indomethacin and acemethacin by
partial least squares. Electrochim. Acta 1998, 43, (5-6), 479-485.
74. Majidi, M. R.; Jouyban, A.; Asadpour-Zeynali, K. Genetic algorithm based potential
selection in simultaneous voltammetric determination of isoniazid and hydrazine
by using partial least squares (PLS) and artificial neural networks (ANNs).
Electroanalysis 2005, 17, (10), 915-918.
75. Leardi, R. Genetic algorithms in chemometrics and chemistry: a review. J.
Chemometr. 2001, 15, (7), 559-569.
76. Goicoechea, H. C.; Olivieri, A. C. A new family of genetic algorithms for wavelength
interval selection in multivariate analytical spectroscopy. J. Chemometr. 2003, 17,
(6), 338-345.
77. Wise, B. M.; Gallagher, N. B.; Bro, R.; Shaver, J. M. PLS_Toolbox 3.01, Eigenvector
Research, Inc.: Manson, 2003.
78. Williams, R. P.; Swinkels, A. J.; Maeder, M. Identification and application of a
prognostic vector for use in multivariate calibration and prediction. Chemometrics
Intell. Lab. Syst. 1992, 15, 185-193.
79. Hoskuldsson, A. Variable and subset selection in PLS regression. Chemometrics
Intell. Lab. Syst. 2001, 55, (1-2), 23-38.
80. Brown, P. J. Wavelength selection in multicomponent near-infrared calibration. J.
Chemometr. 1992, 6, (3), 151-161.
81. Miller, C. E. The use of chemometric techniques in process analytical method
development and operation. Chemometrics Intell. Lab. Syst. 1995, 30, (1), 11-22.
82. Wold, S.; Johansson, E.; Cocchi, M. 3D QSAR. In Drug Design: Theory, Methods
and Applications, 1 ed.; ESCOM, T., Ed. Holland: Leiden, 1993, pp 523-550.
83. Dodds, S. A.; Heath, W. P. Construction of an online reduced-spectrum NIR
calibration model from full-spectrum data. Chemometrics Intell. Lab. Syst. 2005,
76, (1), 37-43.

Tefilo, R. F. 97
84. Ferre, J.; Faber, N. M. Net analyte signal calculation for multivariate calibration.
Chemometrics Intell. Lab. Syst. 2003, 69, (1-2), 123-136.
85. R., M. D. Spectral absorption pattern detection and estimation. I. Analytical
techniques. Appl. Spectrosc. 1977, 31, (5), 404-415.
86. Lorber, A. Error propagation and figures of merit for quantification by solving matrix
equations. Anal. Chem. 1986, 58, (6), 1167-1172.
87. Lorber, A.; Faber, K.; Kowalski, B. R. Net analyte signal calculation in multivariate
calibration. Anal. Chem. 1997, 69, (8), 1620-1626.
88. Ferre, J.; Rius, F. X. Detection and correction of biased results of individual analytes
in multicomponent spectroscopic analysis. Anal. Chem. 1998, 70, (9), 1999-2007.
89. Xu, L. A.; Schechter, I. A calibration method free of optimism factor number
selection for automated multivariate analysis. Experimental and theoretical study.
Anal. Chem. 1997, 69, (18), 3722-3730.
90. Goicoechea, H. C.; Olivieri, A. C. A comparison of orthogonal signal correction and
net analyte preprocessing methods. Theoretical and experimental study.
Chemometrics Intell. Lab. Syst. 2001, 56, (2), 73-81.
91. Wentzell, P. D.; Andrews, D. T.; Kowalski, B. R. Maximum likelihood multivariate
calibration. Anal. Chem. 1997, 69, (13), 2299-2311.
92. Goicoechea, H. C.; Olivieri, A. C. Enhanced synchronous spectrofluorometric
determination of tetracycline in blood serum by chemometric analysis. Comparison
of partial least-squares and hybrid linear analysis calibrations. Anal. Chem. 1999,
71, (19), 4361-4368.
93. Booksh, K. S.; Kowalski, B. R. Theory of analytical chemistry. Anal. Chem. 1994, 66,
(15), 782A-791A.
94. Damiani, P. C.; Ribone, M. E.; Olivieri, A. C. Rapid-determination of paracetamol in
blood-serum samples by first-derivative uv absorption-spectroscopy. Anal. Lett.
1995, 28, (12), 2219-2226.
95. Brown, C. D. Discordance between net analyte signal theory and practical
multivariate calibration. Anal. Chem. 2004, 76, (15), 4364-4373.
96. Bro, R.; Andersen, C. M. Theory of net analyte signal vectors in inverse regression. J.
Chemometr. 2003, 17, (12), 646-652.
97. Faber, N. M. Exact presentation of multivariate calibration model as univariate
calibration graph. Chemometrics Intell. Lab. Syst. 2000, 50, (1), 107-114.
98. Faber, N. M. Mean centering and computation of scalar net analyte signal in
multivariate calibration. J. Chemometr. 1998, 12, (6), 405-409.
99. Faber, N. M. Efficient computation of net analyte signal vector in inverse multivariate
calibration models. Anal. Chem. 1998, 70, (23), 5108-5110.

Tefilo, R. F. 98
100. Brown, C. D.; Ridder, T. D. Framework for multivariate selectivity analysis, part I:
Theoretical and practical merits. Appl. Spectrosc. 2005, 59, (6), 787-803.
101. Booksh, K. S.; Kowalski, B. R. Theory of analytical-chemistry. Anal. Chem. 1994,
66, (15), A782-A791.
102. Mirmohseni, A.; Oladegaragoze, A. Application of the quartz crystal microbalance
for determination of phenol in solution. Sens. Actuator B-Chem. 2004, 98, (1), 28-
36.
103. De la Pena, A. M.; Espinosa-Mansilla, A.; Valenzuela, M.; Goicoechea, H. C.;
Olivieri, A. C. Comparative study of net analyte signal-based methods and partial
least squares for the simultaneous determination of amoxycillin and clavulanic acid
by stopped-flow kinetic analysis. Anal. Chim. Acta 2002, 463, (1), 75-88.
104. Ortiz, M. C.; Sarabia, L. A.; Herrero, A.; Sanchez, M. S.; Sanz, M. B.; Rueda, M. E.;
Gimenez, D.; Melendez, M. E. Capability of detection of an analytical method
evaluating false positive and false negative (ISO 11843) with partial least squares.
Chemometrics Intell. Lab. Syst. 2003, 69, (1-2), 21-33.
105. Boque, R.; Larrechi, M. S.; Rius, F. X. Multivariate detection limits with fixed
probabilities of error. Chemometrics Intell. Lab. Syst. 1999, 45, (1-2), 397-408.
106. Felipe-Sotelo, M.; Cal-Prieto, M. J.; Ferre, J.; Boque, R.; Andrade, J. M.; Carlosena,
A. Linear PLS regression to cope with interferences of major concomitants in the
determination of antimony by ETAAS. J. Anal. At. Spectrom. 2006, 21, (1), 61-68.
107. Sanz, M. B.; Sarabia, L. A.; Herrero, A.; Ortiz, M. C. Capability of discrimination:
application to soft calibration methods. Anal. Chim. Acta 2001, 446, (1-2), 297-
311.
108. Faber, N. M.; Bro, R. Standard error of prediction for multiway PLS 1. Background
and a simulation study. Chemometrics Intell. Lab. Syst. 2002, 61, (1-2), 133-149.
109. Clayton, C. A.; Hines, J. W.; Elkins, P. D. Detection limits with specified assurance
probabilities. Anal. Chem. 1987, 59, 2506-2514.
110. Sarabia, L.; Ortiz, M. C. DETARCHI: a program for detection limits with specified
assurance probabilities and characteristic curves of detection. Trac-Trends Anal.
Chem. 1994, 13, (1), 1-6.
111. Garcia, I.; Sarabia, L. A.; Ortiz, M. C. Detection capability of tetracyclines analysed
by a fluorescence technique: comparison between bilinear and trilinear partial least
squares models. Anal. Chim. Acta 2004, 501, (2), 193-203.
112. Boque, R.; Rius, F. X. Computing detection limits in multicomponent spectroscopic
analysis. Trac-Trends Anal. Chem. 1997, 16, (8), 432-436.
113. Cuadrado, J. A. P.; Forn, M. P. Validacin de mtodos analticos. 1 ed.; A.E.F.I.:
Barcelona, 2001; Vol. 1, p 315.

Tefilo, R. F. 99
114. Cattell, R. B. Parallel proportional profiles and others principles for determining the
choice of factors by rotation. Psychometrika 1944, 9, 267.
115. Tucker, L. R. Implications of factors analysis of three-way matrices for measurement
of change. In Problems of Measuring Change, 1 ed.; Harris, C. W., Ed. University
of Wisconsin Press: Madison, 1963, pp 122-137.
116. Tucker, L. R. Some mathematical notes on three-mode factor analysis.
Psychometrika 1966, 31, 279-311.
117. Harshman, R. A. Foundations of the PARAFAC procedure: Model and conditions
for an 'explanatory' multi-mode factor analysis. UCLA Working Paper in Phonetics
1970, 16, 1.
118. Carroll, J. D.; Chang, J. Analysis of individual differences in multidimensional
scaling via an N-way generalization of and Eckart-Young decomposition.
Psychometrika 1970, 35, 283.
119. Ho, C. N.; Christian, G. D.; Davidson, E. R. Application of method of rank
annihilation to quantitative-analyses of multicomponent fluorescence data from
video fluorometer. Anal. Chem. 1978, 50, (8), 1108-1113.
120. Ho, C. N.; Christian, G. D.; Davidson, E. R. Application of the method of rank
annihilation to fluorescent multicomponent mixtures of polynuclear aromatic-
hydrocarbons. Anal. Chem. 1980, 52, (7), 1071-1079.
121. De Ligny, C.; Spanjer, M.; van Houwelingen, J.; Weeise, H. Three-mode factor
analysis of data on retention in normal-phase high-performance liquid
chromatography. J. Chromatogr. A 1984, 301, 311-324.
122. Wold, S.; Geladi, P.; Esbensen, K.; J., . Multi-way principal components analysis
and PLS analysis. J. Chemometr. 1987, 1, 41-56.
123. Geladi, P. Analysis of Multi-Way (Multi-Mode) data. Chemometrics Intell. Lab.
Syst. 1989, 7, 11-30.
124. Smilde, A. K.; Doornbos, D. A. 3-way methods for the calibration of
chromatographic systems - comparing PARAFAC and 3-way PLS. J. Chemometr.
1991, 5, (4), 345-360.
125. Smilde, A. K. 3-WAY Analyses - problems and prospects. Chemometrics Intell. Lab.
Syst. 1992, 15, (2-3), 143-157.
126. Tomasi, G. Practical and computational aspects in chemometric data analysis. PhD
thesis, The Royal Veterinary and Agricultural University, Frederiksberg, 2006.
127. Diez, R.; Sarabia, L.; Ortiz, M. C. Rapid determination of sulfonamides in milk
samples using fluorescence spectroscopy and class modeling with n-way partial
least squares. Anal. Chim. Acta 2007, 585, (2), 350-360.

Tefilo, R. F. 100
128. Hall, G. J.; Kenny, J. E. Estuarine water classification using EEM spectroscopy and
PARAFAC-SIMCA. Anal. Chim. Acta 2007, 581, (1), 118-124.
129. Holbrook, R. D.; Yen, J. H.; Grizzard, T. J. Characterizing natural organic material
from the Occoquan Watershed (Northern Virginia, US) using fluorescence
spectroscopy and PARAFAC. Sci. Total Environ. 2006, 361, (1-3), 249-266.
130. Zhang, Q. Q.; Zhang, F.; Wang, W. G.; Wang, X. L. Synthesis, crystal structure and
DNA binding studies of a binuclear copper(II) complex with phenanthroline. J.
Inorg. Biochem. 2006, 100, (8), 1344-1352.
131. Valverde, R. S.; Garcia, M.; Galera, M. M.; Goicoechea, H. C. Highly collinear
three-way photoinduced spectrofluorimetric data arrays modelled with bilinear
least-squares: Determination of tetracyclines in surface water samples. Talanta
2006, 70, (4), 774-783.
132. Wang, T.; Zhang, L. D.; Lao, C. L.; Zhao, L. L.; Li, J. H.; Wang, Z. Y.; Huang, W.
J.; Tao, A. W.; Lu-da, Z.; Cai-lian, L.; Long-lian, Z.; Jun-hui, L. i.; Zhong-yi, W.;
Wen-jiang, H. Study on NPLS model with three-dimensional hyperspectrum for
assessing per-mu-yield of winter wheat. Spectrosc. Spectr. Anal. 2006, 26, (10),
1915-1917.
133. Hall, G. J.; Clow, K. E.; Kenny, J. E. Estuarial fingerprinting through
multidimensional fluorescence and multivariate analysis. Environ. Sci. Technol.
2005, 39, (19), 7560-7567.
134. Selli, E.; Zaccaria, C.; Sena, F.; Tomasi, G.; Bidoglio, G. Application of multi-way
models to the time-resolved fluorescence of polycyclic aromatic hydrocarbons
mixtures in water. Water Res. 2004, 38, (9), 2269-2276.
135. Stahle, L. Aspects of the analysis of 3-way data. Chemometrics Intell. Lab. Syst.
1989, 7, 95-100.
136. Bro, R. Multi-way analysis in the food industry. PhD thesis, Royal Veterinary and
Agricultural University, Frederiksberg, 1998.
137. Arancibia, J. A.; Escandar, G. M. Two different strategies for the fluorimetric
determination of piroxicam in serum. Talanta 2003, 60, (6), 1113-1121.
138. Zhang, Y.; Wu, H. L.; Xia, A. L.; Zhu, S. H.; Han, Q. J.; Yu, R. Q. Fluorescence
determination of metoprolol in human plasma by trilinear decomposition-based
calibration techniques. Anal. Bioanal. Chem. 2006, 386, (6), 1741-1748.
139. Xia, A. L.; Wu, H. L.; Fang, D. M.; Ding, Y. J.; Hu, L. Q.; Yu, R. Q. Determination
of daunomycin in human plasma and urine by using an interference-free analysis
of excitation-emission matrix fluorescence data with second-order calibration.
Anal. Sci. 2006, 22, (9), 1189-1195.
140. Sanchez, E.; Kowalski, B. R. Generalized rank annihilation factor-analysis. Anal.
Chem. 1986, 58, (2), 496-499.

Tefilo, R. F. 101
141. Sanchez, E.; Kowalski, B. R. Tensorial resolution: a direct trilinear decomposition. J.
Chemometr. 1990, 4, 29-45.
142. Faber, N. M.; Bro, R.; Hopke, P. K. Recent developments in
CANDECOMP/PARAFAC algorithms: a critical review. Chemometrics Intell.
Lab. Syst. 2003, 65, (1), 119-137.
143. Tomasi, G.; Bro, R. A comparison of algorithms for fitting the PARAFAC model.
Comput. Stat. Data Anal. 2006, 50, (7), 1700-1734.
144. Yates, F. The analysis of replicated experiments when the field results are
incomplete. The empire journal of experimental agriculture 1933, 1, 129-135.
145. Bro, R.; Kiers, H. A new efficient method for determining the number of
components in PARAFAC models. J. Chemometr. 2003, 17, (5), 274-286.
146. Bro, R. N-Way tutorial: curso on-line. Royal Veterinary and Agricultural University:
Frederiksberg, pp 1-72.
147. Harshman, R. A. How can I know if it's 'real' ? In Research methods for multimode
data analysis, 1 ed.; Law, H. G., Snyder, C. W., Hattie, J. A. and MacDonald, R.
P., Eds. Praeger: New York, 1984, pp 566.
148. Riu, J.; Bro, R. Jack-knife technique for outlier detection and estimation of standard
errors in PARAFAC models. Chemometrics Intell. Lab. Syst. 2003, 65, (1), 35-49.
149. Smilde, A. K. Comments on multilinear PLS. J. Chemometr. 1997, 11, (5), 367-377.
150. Martins, J. P. A. unpublished results. Campinas, 2007.
151. Wu, W.; Guo, Q.; Massart, D. L.; Boucon, C.; de Jong, S. Structure preserving
feature selection in PARAFAC using a genetic algorithm and Procrustes analysis.
Chemometrics Intell. Lab. Syst. 2003, 65, (1), 83-95.
152. Lopes, J. A.; Menezes, J. C. Industrial fermentation end-product modelling with
multilinear PLS. Chemometrics Intell. Lab. Syst. 2003, 68, (1-2), 75-81.
153. Gourvenec, S.; Capron, X.; Massart, D. L. Genetic algorithms (GA) applied to the
orthogonal projection approach (OPA) for variable selection. Anal. Chim. Acta
2004, 519, (1), 11-21.
154. Carneiro, R. L.; Braga, J. W. B.; Bottoli, C. B. G.; Poppi, R. J. Application of genetic
algorithm for selection of variables for the BLLS method applied to determination
of pesticides and metabolites in wine. Anal. Chim. Acta 2007, 595, 51-58.
155. Tefilo, R. F.; Martins, J. P. A.; Ferreira, M. M. C. OPS Toolbox 1.0, Registro de
Software no INPI - 0000270703255138: Brasil, 2007.
156. Tefilo, R. F.; Martins, J. P. A.; Ferreira, M. M. C. In Ordered predictors Selection: an
intuitive method to find the most relevant variable in multivariate calibration, 10th
International Conference on Chemometrics in Analytical Chemistry, guas de Lindia,
Brazil, guas de Lindia, Brazil, 2006, P066.

Tefilo, R. F. 102

Apndice 1. Tpicos de lgebra Linear

Tefilo, R. F. 103
Apndice
Tpicos de lgebra Linear
O conhecimento pertence humanidade
e a tocha que ilumina o mundo
Louis Pasteur
Como muitas das operaes e definies algbricas foram utilizadas nesta
tese, apropriado que os principais tpicos sejam descritos para orientar o leitor
interessado. Assim, tpicos foram selecionados de alguns livros texto e sero
descritos a seguir [1-6].
1. Sistema linear
Todo sistema linear de I equaes e J incgnitas podem ser escrito como uma
simples equao matricial Xb = y em que
11 12 1 1 1
21 22 2 2 2
1 2
, = , e =
J
J
I I IJ J I
x x x b y
x x x b y
x x x b y

| | | | | |
| | |

| | |
=
| | |
| | |
\ . \ . \ .
X b y
Portanto, toda equao matricial da forma
1 1 I J J I
= X b y representa um
sistema de I equaes lineares em J incgnitas.
2. Posto de uma matriz
O posto de uma matriz definido como nmero de linhas ou colunas
linearmente independentes da matriz completa. Pode ser definido mais
Apndice 1. Tpicos de lgebra Linear

Tefilo, R. F. 104
especificamente como nmero de pivs da matriz escalonada quando se emprega a
eliminao de Gauss [1,2].
3. Adio de matrizes
Se X e V so matrizes IJ, a soma de X e V definida ser uma matriz IJ,
obtida por adio das entradas correspondentes, i.e.
[X + V]
ij
=[X]
ij
+ [V]
ij
para cada i e j.
4. Multiplicao de escalar
O produto de um escalar , vezes uma matriz X, indicado por X, definido
ser a matriz obtida por multiplicao de cada entrada de X por , i.e.
[X]
ij
= [X]
ij
para cada i e j.
5. Multiplicao matricial
Matrizes X e V so ditas ser semelhantes para multiplicao na ordem XV
quando o nmero de colunas de X exatamente igual ao nmero de linhas de V,
i.e., X IP e V PJ.
Para matrizes compatveis X
IP
= [x
ip
] e V
PJ
= [v
pj
], o produto matricial XV
definido ser a matriz IJ cujas (i,j) entradas o produto interno da i-sima linha de
X com a j-sima coluna em V, i.e.,
* * 1 1 2 2
1
[ ]
P
ij i j i j i j ip pj ip pj
p
x v x v x v x v
=
= = + + + =

XV X V
No caso de X e V falharem na compatibilidade i.e., X ser IP e V ser FJ com
P F, ento nenhum produto XV definido.
A multiplicao de matrizes uma operao no comutativa i.e., XV VX,
mesmo quando ambos os produtos existem e tem a mesma forma. Porm, as
seguintes leis distributivas e associativa existem: X(V + G) = XV + XG (lei
distributiva esquerda); (D + E)F = DF + EF (lei distributiva direita); X(VG) =
(XV)G (lei associativa).
Apndice 1. Tpicos de lgebra Linear

Tefilo, R. F. 105
6. Produtos Kronecker e Khatri-Rao
Para descrever modelos multimodos, o usual produto matricial no
suficiente. Dois outros produtos sero introduzidos aqui: o de Kronecker ( ) e o
de Khatri-Rao ( ).
Considere duas matrizes A(IJ) e B(KM). O produto Kronecker destas
matrizes definido como
11 1

1

J
I J K M
I IJ
IK JM
a a
a a

(
(
=
(
(

B B
A B
B B

Note que o produto Kronecker tambm definido para duas matrizes as quais
o produto matricial usual no existe (se J K)
O produto Khatri-Rao definido como segue
A = [a
1
...a
J
] e C = [c
1
...c
J
]
A B = [a
1
c
1
...a
J
c
J
]
Note que o produto Khatri-Rao exige que as matrizes a serem processadas
tenham o mesmo nmero de colunas.
7. Matriz transposta
A transposta de X
IJ
definida como a matriz JI X
t
obtida pela troca de
linhas e colunas em X. Mais precisamente, se X = [a
ij
], ento [X
t
]
ij
= a
ji
. Por
exemplo:
t
3 5
3 7 8
7 2
5 2 1
8 1
| |
| |
|
=
|
|
\ .
|
\ .

, portanto evidente que para todas as matrizes (X
t
)
t
= X.
A lei da ordem reversa da transposio para matrizes compatveis X e V :
(XV)
t
= V
t
X
t
.
A transposio no muda o posto de uma matriz i.e., posto(X) = posto(X
t
).
Apndice 1. Tpicos de lgebra Linear

Tefilo, R. F. 106
8. Combinaes lineares
Para escalares
j
e matrizes X
j
, a expresso
2 1 2 2
1
J
J J j j
j
o o o o
=
+ + + =

X X X X
chamada uma combinao linear de X
js
.
Quando for referido que h uma combinao linear de uma matriz, significa
que h uma combinao linear das colunas da matriz. Por exemplo, se X uma
matriz IJ, ento uma combinao linear de X
1 1 2 2 J J
b b b = = + + + c Xb x x x
Em que x
1
, x
2
,...,x
J
representa as J colunas de X e b = (b
1
, b
2
,...,b
J
)
t
um vetor
J1 de pesos. O resultado um vetor c I1.
9. Covarincia
Dado dois vetores centrados na mdia x
j
e x
k
, a covarincia da amostra
expressa como
t
cov( )
j k j k
= x x x x
Em que o escalar I 1 implicado para uma amostra.
10. Matriz identidade
A matriz JJ com 1s na diagonal principal e 0s em todas as outras posies,
i.e.
1 0 0
0 1 0
0 0 1
J
| |
|
|
=
|
|
\ .
I
chamada de matriz identidade de ordem J. Para toda matriz X IJ, XI
J
= X e
I
I
X = X.
Apndice 1. Tpicos de lgebra Linear

Tefilo, R. F. 107
O subscrito em I
J
negligenciado quando a dimenso bvio a partir do
contexto.
11. Inverso matricial
Para uma dada matriz quadrada X
JJ
, a matriz V
JJ
que satisfaz as condies
XV = I
J
e VX = I
J
. chamada de inversa de X e denominada por V = X
-1
. Nem
todas as matrizes quadradas so invertveis a matriz zero um exemplo trivial,
mas h tambm muitas matrizes diferentes da matriz zero que no so invertveis.
Uma matriz invertvel definida como no-singular e uma matriz quadrada que no
possui uma inversa chamada de matriz singular.
Embora, computacionalmente, a inverso de matrizes no deva ser usada (e
no ) para resolver o sistema Xb = y, h algumas poucas aplicaes onde o
conhecimento explcito de X
-1
desejvel. Para isto, os dois mais eficientes
algoritmos (no descritos aqui) que podem ser usados se baseiam na eliminao de
Gauss-Jordan e na decomposio LU.
O uso da eliminao Gauss-Jordan para inverter uma matriz consiste do
seguinte princpio:
1
[ ] [ ]
Gauss Jordan
XI I X . Este clculo exige J
3

multiplicaes/divises e J
3
2J
2
+ J adies/subtraes, portanto o custo
computacional de uma inverso muito alto e h maneiras para resolver o sistema
Xb = y com custo extremamente inferiores ao procedimento de inverso explcita.
12. Sistema linear mal condicionado
Uma matriz no-singular X dita ser mal-condicionada se uma pequena
mudana relativa em X causa uma grande mudana relativa em X
-1
. De outro
modo, o sistema dito ser bem condicionado. O grau de mal-condicionamento
medido por um nmero de condio
1
k

= X X , em que - a norma da
matriz.
Em outras palavras, quando X bem condicionada (i.e. quando pequeno),
isto garante que pequenas incertezas relativas em y no afetam significativamente a
soluo, mas quando X mal condicionada (i.e., quando grande), uma incerteza
relativamente pequena em y pode resultar em uma incerteza relativamente grande
em b.
Apndice 1. Tpicos de lgebra Linear

Tefilo, R. F. 108
13. Independncia linear
Conjuntos linearmente independentes so aqueles que no contm relao de
dependncia e conjuntos linearmente dependentes so aqueles em que no mnimo
um vetor a combinao dos outros.
Deixe X ser uma matriz IJ. Se posto (X) = J, as colunas de X formam um
conjunto linearmente independente e se o posto(X
t
) = I, as linhas de X formam um
conjunto linearmente independente.
Quando X quadrada, cada uma das seguintes afirmaes equivalente a
dizer que X no-singular.
- As colunas de X formam um conjunto linearmente independente.
- As linhas de X formam um conjunto linearmente independente.
14. Sistema linear determinado
Cada uma das seguintes afirmaes equivalente a dizer que o sistema linear
[ ] X y determinado.
1. Em uma reduo de linhas de [ ] X y (eliminao de Gauss), uma linha da
seguinte forma nunca aparece:
( )
0 0 0 o , em que 0 o = .
2. y uma coluna que no uma base de [ ] X y .
3. posto [ ] X y = posto(X)
4. y uma combinao das colunas linearmente independentes em X.
15. Equaes normais
Para um sistema (IJ) Xb = y, o sistema associado de equaes normais
definido ser o sistema (JJ) X
t
Xb = X
t
y.
X
t
Xb = X
t
y sempre determinado, mesmo quando Xb = y no determinado.
Quando Xb = y determinado, sua soluo concorda com aquela de X
t
Xb =
X
t
y. As equaes normais fornecem solues de quadrados mnimos para Xb = y
quando Xb = y indeterminado.
X
t
Xb = X
t
y tem uma soluo nica se e somente se o posto(X) = J. Neste caso
a soluo nica b = (X
t
X)
-1
X
t
y.
Apndice 1. Tpicos de lgebra Linear

Tefilo, R. F. 109
Quando Xb = y determinado e tem uma soluo nica, ento o mesmo
verdadeiro para X
t
Xb = X
t
y, e a soluo nica para ambos os sistemas dados por
b = (X
t
X)
-1
X
t
y.
16. Problema geral de quadrados mnimos
Muitos problemas, quando modelados, levam a sistemas lineares Xb = y, que
so indeterminados (i.e., no possuem soluo), apesar dos problemas que os
originaram necessitarem de uma soluo. A no existncia de soluo vem com
freqncia devido a erros experimentais no vetor y ou devido ao mal-
condicionamento na matriz X. Uma forma de resolver o sistema indeterminado
atravs das projees por quadrados mnimos, ou seja,
Para
I J
e9 X e
I
e9 y , deixe = (b) = Xb y. O problema geral de
quadrados mnimos encontrar um vetor b que minimiza a quantidade:

t
= (Xb- y)
t
(Xb y) =
2
Xb y , que nada mais que minimizar a soma
quadrtica dos erros.
Qualquer vetor que fornece um valor mnimo para esta expresso chamado
de soluo de quadrados mnimos.
- O conjunto de todas as solues de quadrados mnimos precisamente o
conjunto de solues das equaes normais.
- H uma nica soluo de quadrados mnimos se e somente se o posto(X) = J.
Neste caso a nica soluo b = (X
t
X)
-1
X
t
y.
- Se Xb = y determinado, ento a soluo para Xb = y a mesma fornecida
pela soluo de quadrados mnimos.
17. Norma vetorial Euclidiana
Para um vetor x
J x 1
, a norma euclidiana de x definida por
( )
1/ 2
2 t
1
J
i i=
= =

x x x x , em que
1 J
e9 x
Apndice 1. Tpicos de lgebra Linear

Tefilo, R. F. 110
18. Ortogonalidade
Em um produto interno do espao v , dois vetores , v e x y so ortogonais (um em
relao ao outro) para
J
9 , quando
t
0 = = x y x y , e isto indicado escrevendo
x y .
19. Ortonormalidade
Considere um conjunto de vetores { }
1 2
, ,...,
J
| = u u u . Este conjunto
chamado de ortonormal quando 1
i
= u para cada i e
i j
u u para todo i j = . Em
outras palavras,
1 quando ,
0 quando .
i j
i j
i j
=

u u
- todo conjunto ortonormal linearmente independente.
- todo conjunto ortonormal de J vetores de um espao J-dimensional v uma
base ortonormal para v .
20. Matrizes ortogonais
Uma matriz ortogonal definida como uma matriz real
J J
U cujas colunas
(ou linhas) constituem uma base ortonormal para
J
9 .
Matrizes ortogonais tm algumas caractersticas excelentes, uma delas o fato
que elas so fceis de inverter. Note que as colunas de
1 2
( | | | )
n n n
= U u u u so
um conjunto ortonormal se e somente se,
t t t -1 t
1 quando ,
[ ]
0 quando .
ij i j
i j
i j
=

= = = =

U U u u U U I U U .
Note que devido
t t
= = U U I UU I , as colunas de U so ortonormais se e
somente se a linhas de U sejam ortonormais.
Outra caracterstica destas matrizes que a multiplicao por um vetor no
muda o comprimento do vetor. Apenas a direo pode ser alterada, assim:
2 2
t t t
= = = Ux x U Ux x x x para todo
1 J
e9 x .
Apndice 1. Tpicos de lgebra Linear

Tefilo, R. F. 111
21. Decomposio dos Valores Singulares


Para todo
I J
e9 X de posto h, existem matrizes ortogonais
I I
A ,
J J
P e
uma matriz diagonal
1 2
diag( )
h h h
o o o

= > > > D tais que


t

0
0 0
I J
| |
=
|
\ .
D
X A P com
1 2
0
h
o o o > > > >
Os
i
o s so chamados de valores singulares diferentes de zero de X. Quando
h < (p = min{I, J}), X dito ter p h adicionais valores zeros. Esta fatorao
chamada de decomposio dos valores singulares (SVD) de X e as colunas em A e
P so chamadas vetores singulares do lado esquerdo e direito de X,
respectivamente.
- Os quadrados dos valores singulares (
2
i
o ) so os autovalores de X
t
X (e XX
t
).
- Os vetores a
i
em A, so os autovetores de XX
t
associados a
2
i
o .
- Os vetores p
i
em P, so os autovetores de X
t
X associados a
2
i
o .
22. Moore-Penrose Pseudoinversa


Em termos da decomposio SVD, pode se escrever da seguinte maneira a
Moore-Penrose Pseudoinversa de X:
Sabendo que
t


0
0 0
h h
I J
I J


| |
=
|
\ .
D
X A P , a pseudo inversa de X :
1
+ t

0
0 0
I J

| |
=
|
\ .
D
X P A .
- Quando Xb = y determinado, b = X
+
y a soluo de norma euclidiana
mnima.

A SVD foi descoberta e redescoberta vrias vezes. O crdito para os primeiros desenvolvedores vai para Eugenio
Beltrami (1835 1899) em 1873, M. E. Camille Jordan (1838 1922) em 1875, James J. Sysvester (1814 1897)
em 1889, L. Autonne em 1913 e C. Eckart e G. Young em 1936.

Em honra a Eliakim H. Moore (18621932) e Roger Penrose (um famoso e contemporneo fsico matemtico
ingls). Cada um formulou um conceito da inverso matricial generalizada O trabalho de Moore foi publicado em
1922, e o trabalho de Penrose apareceu em 1955. E. H. Moore considerado por muitos, como o primeiro grande
matemtico americano.
Apndice 1. Tpicos de lgebra Linear

Tefilo, R. F. 112
- Quando Xb = y indeterminado, b = X
+
y a soluo de quadrados mnimos
de norma euclidiana mnima.
Referncias
1. Meyer, C. D. Matrix analysis and linear algebra. SIAM Publications: New York,
2000; p 718.
2. Strang, G. Linear algebra and its applications. 3 ed.; Thomson Learning, Inc.:
Lomdon, 1988; p 505.
3. Smilde, A.; Bro, R.; Geladi, P. Multi-way analysis with applications in the chemical
science. John Wiley & Sons Inc: Chinchester, 2004; p 379.
4. Naes, T.; Isaksson, T.; Fearn, T.; Davies, T. Multivariate calibration and classification.
Nir publications: Chinchester, 2002; p 344.
5. Mason, R. L.; Gunst, R. F.; Hess, J. L. Statistical desing and analysis of experiments. 2
ed.; John Wiley & Sons Inc: Hoboken, 2003; p 730.
6. Winefordner, J. D. Chemometrics: From basics to wavelet transform. John Wiley &
Sons Inc: New Jersey, 2004; Vol. 164, p 292.

Apndice 1. Tpicos de lgebra Linear

Tefilo, R. F. 113

You might also like