Professional Documents
Culture Documents
PIRACICABA
Estado de So Paulo Brasil
Junho 2005
ANLISE DE VARINCIA MULTIVARIADA COM A UTILIZAO DE
TESTES NO-PARAMTRICOS E COMPONENTES PRINCIPAIS
BASEADOS EM MATRIZES DE POSTOS
PIRACICABA
Estado de So Paulo Brasil
Junho 2005
Dados Internacionais de Catalogao na Publicao (CIP)
DIVISO DE BIBLIOTECA E DOCUMENTAO - ESALQ/USP
CDD 519.53
Permitida a cpia total ou parcial deste documento, desde que citada a fonte O autor
Aos meus filhos, Antonio Carlos Jr, Carlos Eduardo e Ana Carolina e
minha esposa, Loide, por sua pacincia e dedicao, eu dedico.
Ao Prof. Dr. Carlos Tadeu dos Santos Dias, meu orientador, cuja
pacincia, cooperao e apoio foram fundamentais para a realizao deste trabalho.
Pgina
LISTA DE TABELAS .................................................................................................. vii
RESUMO ...................................................................................................................... ix
SUMMARY................................................................................................................... x
1 INTRODUO ....................................................................................................... 1
2 REVISO DE LITERATURA ................................................................................ 6
2.1 Testes de normalidade multivariada ...................................................................... 14
2.2 Testes de aleatorizao uni e multivariados ........................................................... 20
2.3 Testes no-paramtricos multivariados utilizando transformaes de dados
separadamente, para cada uma das variveis ....................................................... 22
2.4 Mediana multivariada ............................................................................................ 28
2.5 Combinao de testes independentes e testes de independncia ........................... 31
2.6 Testes multivariados baseados na distncia entre os dados ................................... 36
2.7 Anlise de componentes principais (PCA) e assuntos correlacionados ................. 40
3 METODOLOGIA .................................................................................................... 45
3.1 Notao .................................................................................................................. 46
3.2 Materiais e mtodos ............................................................................................... 49
3.2.1 Mtodo 1 ............................................................................................................. 50
3.2.2 Mtodo 2 ............................................................................................................. 54
4 RESULTADOS E DISCUSSO.............................................................................. 66
4.1 Exemplo 1. Dados fictcios (dois grupos e duas variveis) ................................ 67
vi
Pgina
2 Teste de Wilks para as configuraes com dois grupos de trs elementos ............ 70
4 Tamanho da amostra e mdias, para cada grupo, antes e depois do tratamento .... 75
RESUMO
Mtodos no-paramtricos tm aplicao ampla na anlise de dados,
tendo em vista que no so limitados pela necessidade de imposio de distribuies
populacionais especficas. O carter multivariado de dados provenientes de estudos nas
cincias do comportamento, ecolgicos, experimentos agrcolas e muitos outros tipos, e
o crescimento contnuo da tecnologia computacional, tm levado a um crescente
interesse no uso de mtodos multivariados no-paramtricos. A aplicao da anlise de
varincia multivariada no-paramtrica pouco inacessvel ao pesquisador, exceto
atravs de mtodos aproximados baseados nos valores assintticos da estatstica de teste.
Portanto, este trabalho tem por objetivo apresentar uma rotina na linguagem C que
realiza testes baseados numa extenso multivariada do teste univariado de Kruskal-
Wallis, usando a tcnica das permutaes. Para pequenas amostras, todas as
configuraes de tratamentos so obtidas para o clculo do valor-p. Para grandes
amostras, um nmero fixo de configuraes aleatrias usado, obtendo assim valores de
significncia aproximados. Alm disso, um teste alternativo apresentado com o uso de
componentes principais baseados nas matrizes de postos.
MULTIVARIATE ANALYSIS OF VARIANCE USING NONPARAMETRIC
TESTS AND PRINCIPAL COMPONENTS BASED ON RANK MATRICES
SUMMARY
Nonparametric methods have especially broad applications in the
analysis of data since they are not bound by restrictions on the population distribution.
The multivariate character of behavioural, ecological, agricultural and many other
types of data and the continued improvement in computer technology have led to a
sharp interest in the use of nonparametric multivariate methods in data analysis. The
application of nonparametric multivariate analysis is inaccessible to applied research,
except by approximation methods based on asymptotic values of the test statistic.
Thus, this work aims to presenting a routine in the C language that runs multivariate
tests based on a multivariate extension of the univariate Kruskal-Wallis test, using
permutation technique. For small samples, all possible treatment configurations are
used in order to obtain the p-value. For large samples, a fixed number of random
configurations are used, obtaining an approximated significance values. In addition,
another alternative test is presented using principal components based on rank
matrices.
1 INTRODUO
2 REVISO DE LITERATURA
extremos para o centro, fazendo com que os valores mais afastados do valor central
tenham os menores postos ou vice-versa. Algumas outras formas de transformaes de
postos so apresentadas em Negrillo (1985).
No caso multivariado, ainda tem-se outras observaes a serem feitas em
relao atribuio de postos. A atribuio de postos de forma conjunta a todas as
observaes esbarra na verificao de que, sob a hiptese nula, em geral, as permutaes
ocorrem entre os elementos amostrais e no entre as observaes em si. Por outro lado, a
atribuio de postos a cada varivel, de forma individual, denominada atribuio
componentwise, tem sido criticada por no levar em conta as correlaes existentes entre
as variveis. Deve-se levar em conta, porm, que na anlise multivariada paramtrica
usual, a atribuio de valores s variveis feita de forma isolada, no havendo
nenhuma meno correlao entre as variveis, j que ela intrnseca ao prprio dado
obtido. As relaes existentes entre as variveis so, assim, consideradas nas estatsticas
de testes utilizadas para a verificao das hipteses de interesse.
Outra crtica aos mtodos que utilizam a atribuio de postos de forma
isolada para cada varivel refere-se ao tipo de mediana multivariada que est sendo
considerada nessa atribuio, que baseada na composio das medianas individuais
relacionadas a cada uma das variveis em estudo. Assim, vrias outras formas vm
sendo discutidas para a mediana multivariada e, conseqentemente, para a atribuio de
postos s variveis levando em conta essas novas medianas. Observa-se que nenhuma
mediana multivariada apresentada na literatura considerada ideal. Essas medianas so
valores obtidos a partir de conceitos criados pelos pesquisadores, que vo desde a
minimizao de distncias minimizao de simplexes (reas, volumes, hiper-volumes)
que, entretanto, no agregam todas as concepes desejveis para uma medida de
posio multivariada. Tais consideraes sero abordadas com maiores detalhes nas
Sees 2.3 e 2.4, onde so discutidos os mtodos multivariados no-paramtricos
apresentados na literatura.
A considerao de testes de postos (no-paramtricos) na presena de
duas variveis j antiga. O coeficiente de correlao de Spearman, uma das mais
antigas medidas de relacionamento de duas variveis mostra essa preocupao.
9
uma amostra seja proveniente de uma populao cujos membros podem ser estudados
atravs de uma distribuio normal. De acordo com Johnson & Wichern (1999), em
Anlise Multivariada, muitas das tcnicas assumem que o vetor de observaes Xj tem
uma distribuio normal multivariada. Por outro lado, em situaes em que o tamanho
da amostra grande e as tcnicas dependem somente da natureza do vetor de mdias X
ou distncias que envolvem esse vetor, a suposio de normalidade dos dados no to
importante. Entretanto, a qualidade das inferncias feitas por esses mtodos depende de
quo prximos da multinormalidade esto os dados sobre os quais sero feitas
inferncias.
Alguns mtodos para deteco de multinormalidade foram discutidos na
literatura. Dentre eles podem ser citados mtodos grficos tais como a representao
atravs de stalactite plot (Atkinson & Mulira, 1992) ou ainda generalizaes dos
mtodos univariados (medidas generalizadas de simetria e curtose, por exemplo).
Para Johnson & Wichern (1999), as pesquisas referentes normalidade
podem se concentrar apenas em variveis isoladas ou grupos bivariados (distribuies
marginais e scatterplots), pois difcil construir um bom teste para normalidade
conjunta em mais do que duas dimenses. No caso multivariado, os testes de
normalidade univariada tm como principal objetivo verificar a normalidade de
distribuies marginais. Dentre eles, tem-se o exame do histograma e das caudas da
distribuio e a verificao de normalidade atravs de grficos, como, por exemplo, o Q-
Q Plot (quantile vs quantile plot). Entretanto, as verificaes grficas tm utilidade
apenas nos casos em que o ajuste de uma determinada distribuio terica a um conjunto
de dados graficamente bvio, ou ainda quando existem dados muito discrepantes em
relao distribuio proposta. Nos casos em que h dvidas a respeito do ajuste, a
subjetividade do mtodo pode levar a concluses diferentes, dependendo do
pesquisador. Assim, torna-se importante que o mtodo grfico seja complementado por
testes objetivos. Um teste bastante citado na literatura o de Shapiro & Wilk (1965),
baseado na regresso das observaes ordenadas contra os valores das estatsticas de
ordem da distribuio padronizada assumida. Comparaes entre os diversos testes para
normalidade so feitas em Shapiro et al. (1968). Outros testes so o teste de qualidade de
16
V = ( Y 0 )' 1 ( Y 0 ) ~ 2p (1)
em que S(V) a funo de distribuio acumulada amostral baseada em V1, V2, ..., Vn e
Fp(V) a funo distribuio acumulada da distribuio de Qui-quadrado com p graus de
liberdade (p2).
A estatstica de Kolmogorov-Smirnov (KS) calculada obtendo-se o
mximo das diferenas entre a funo distribuio acumulada observada e a funo
distribuio acumulada emprica, ou seja,
KS = max S ( V ) F p ( V ) . (4)
V
em que A = j =1 ( Y j Y )( Y j Y )' ;
n
W =*
[ a U ]
j ( j)
2
(6)
(Y m Y )' A 1 ( Ym Y )
em que aj so os valores tabelados por Shapiro-Wilks.
Valores pequenos de W* indicam no normalidade multivariada.Valores
crticos para o teste foram obtidos por simulao.
18
1, p = E{( y )' 1 ( y )} .
3
(7)
2 , p = E{( y )' 1 ( y )} .
2
(8)
1 n 2 1 n 4
2 , p = g ii = n
n i =1 i =1
d i em que d i = g ii (10)
2 , p p( p + 2 )
2 = ~ N ( 0 ,1 ) (12)
8 p( p + 2 ) / n
19
proporo das permutaes como regio crtica e que para alguns testes, esse pode ser a
nica maneira de obter testes exatos de significncia.
Uma generalizao para o teste t aplicada a dados multivariados
apresentada por Arnold (1964), para dados com distribuies normais bivariadas,
retangular e dupla exponencial. O autor verifica haver pouca discrepncia entre o nvel
de significncia do teste quando se considera que a suposio de normalidade vlida
para o conjunto de dados e o valor de significncia obtido considerando todas as
permutaes de cada amostra igualmente provveis, para as amostras provenientes de
populaes com distribuio retangular e dupla exponencial.
Bell & Sen (1984) discutem testes de aleatorizao, sua estrutura, e, mais
detalhadamente, testes para hipteses de invarincia, incluindo testes de independncia
multivariada, e testes envolvendo postos.
Em Mielke et al. (1981), os autores apresentam um teste no-paramtrico
de postos univariado baseado em procedimentos de permutao, com dados
multivariados, em que a transformao dos dados multivariados em univariados feita
atravs do clculo das distncias entre pontos. O teste apresentado pelos autores
relacionado ao teste de Wilcoxon-Mann-Withney, no caso de dois grupos, e o teste de
Kruskal-Wallis, para mais de dois grupos. Mielke & Iyer (1982) desenvolvem o mtodo
para a anlise de dados multivariados num delineamento em blocos casualizados e em
Berry & Mielke (1984) apresentado um programa computacional para o clculo dos
valores-p, que denominado procedimento de permutao multi-resposta (multi-
response permutation procedure MRPP).
Vrios livros tm sido publicados recentemente discutindo e
apresentando a teoria, as utilizaes e exemplos relacionados aos testes de permutao,
podendo ser destacados os livros de Edgington (1995), Good (2000) e Pesarin (2001).
Nesse ltimo, um mtodo de combinao de testes no-paramtricos apresentado, que
depende, naturalmente, das hipteses que esto verificadas, em que as combinaes dos
valores-p individuais, referentes a cada uma das hipteses independentes, so feitas
pelos mtodos considerados em Hedges & Olkin (1985).
22
testar as diferenas entre os dois grupos. Para facilitar a obteno dos valores crticos do
teste, pode-se tomar m = min(m,n) e, ainda, se p = 1, os testes baseados nas estatsticas
T1 e T2 equivalem ao teste de Wilcoxon-Mann-Whitney. O teste proposto simples de
ser implementado, mesmo para grandes amostras, utilizando um conjunto restrito de
permutaes dos dados nos dois grupos, mas pode no ser adequado nos casos em que
23
B2 = (
nm ( 1 )
) ( )
x x ( 2 ) ' S 1 x ( 1 ) x ( 2 ) =
(N 1)T 2 (13)
N N 2+T 2
No caso em que os dados originais so substitudos por seus postos,
atribudos de forma individual para cada varivel, a estatstica B2 pode ser escrita como
12 n( N + 1 ) 1 n( N + 1 )
B r2 = P1 1 ' R P1 1 (14)
( N + 1 )nm 2 2
em que o elemento i (i=1,...,p) do vetor P1 so obtidos pela soma dos postos do grupo 1
para a varivel i e R a matriz de correlao de postos. Quando se tomam os escores
normais no lugar dos dados originais, outras simplificaes ocorrem.
Discusses tericas a respeito de testes multivariados para uma, duas e
trs ou mais amostras, incluindo distribuio assinttica das permutaes, eficincia
assinttica dos testes e regies de confiana, so apresentadas em Tamura (1966), Sen
(1967), Sen & Puri (1967), Puri & Sen (1967), Puri & Sen (1968), Sen (1969), dentre
outros. Essa teoria apresentada de forma mais completa e detalhada em Puri & Sen
(1971).
Testes no-paramtricos para dados bivariados, focalizados no problema
de locao para duas amostras so apresentados por Fryer (1970). Considerando a
hiptese nula de igualdades das funes de distribuies bivariadas para as variveis X e
Y quando se consideram duas amostras, ou seja, F1(x,y) = F2(x,y), trs estatsticas so
apresentadas, uma para cada hiptese alternativa (diferenas irrestritas, diferenas em
uma nica direo para ambas as variveis e diferena em direes opostas para as
24
t1 =
( )
1 rs2 nm( N + 1 )
1
[S 2
]
+ S 22 2 rs S 1 S 2 ( e irrestritos)
1 (15)
12
nm( N + 1 )(1 + rs )
1 / 2
nm( N + 1 )(1 rs )
1 / 2
# (t max i t max ) como o nmero de valores t maxi maiores do que tmax, o valor-p ser
n
dado pela proporo # (t maxi t max ) / C N para o caso em que a hiptese alternativa
seja a de que o tratamento melhor do que o placebo para ao menos uma das variveis.
25
Para a hiptese de que o tratamento melhor do que o placebo para todas as variveis, o
n
valor-p ser dado por # (t maxi t max ) / C N . Caso o nmero de combinaes seja
proibitivo, pode-se utilizar uma amostra aleatria das combinaes possveis. possvel
perceber que o procedimento no leva em conta a interdependncia dos componentes
(variveis) de forma explcita e tem sua base nos testes de comparaes mltiplas.
Uma outra alternativa proposta por Dietz & Killeen (1981), que definem
um teste no-paramtrico multivariado para tendncia monotnica, apresentando
aplicaes a testes de drogas farmacuticas. Os autores estendem o teste univariado de
Mann (1945) para o caso multivariado. Considerando a matriz de dados X em que cada
coluna contm uma das p variveis e cada linha representa os dados observados nos
tempos 1, 2, ..., n, os postos so atribudos aos dados de forma independente para cada
varivel, (coluna), obtendo-se a matriz P. A estatstica de teste multivariado proposta
obtida atravs da combinao das p estatsticas univariadas de Mann Ki (i = 1,...,p)
calculadas independentemente, dada pela forma quadrtica ' S 1 sendo K =
(K1,...,Kp) e S-1 a inversa da matriz de varincias e covarincias amostral obtida a partir
dos dados originais. Entretanto, devido ao uso da matriz de varincias e covarincias
amostrais relativa aos dados originais, pode fazer com que o teste fique muito sensvel a
dados discrepantes, podendo tornar o teste falho em algumas situaes. Os autores
mostram que tal estatstica tem distribuio assinttica 2p. Dietz (1982) discute um teste
semelhante na forma, que generaliza o teste dos sinais e o teste de Wilcoxon,
originariamente desenvolvido para uma amostra e uma varivel, para duas ou mais
variveis. Como no trabalho anterior (Dietz & Killeen, 1981), vetores das estatsticas
obtidas para cada uma das variveis separadamente so combinados com a matriz de
varincias e covarincias dessas mesmas variveis.
Katz & McSweeney (1980) apresentam uma extenso multivariada do
teste de Kruskal-Wallis, derivando a distribuio de referncia para grandes amostras da
estatstica de teste, alm de fornecer frmulas simples para a obteno da estatstica de
teste. Procedimentos para a realizao de testes de comparaes mltiplas so
apresentados e comparados. A tcnica apresentada pelos autores para a obteno da
26
matriz de varincias e covarincias amostrais total SR = {sij}, i,j = 1,...,p. Essa matriz
pode ser subdividida na matriz de hipteses (HR) e na de erros residuais (ER), de tal
forma que SR = HR + ER e o trao de Pillai V dado por V = trao(HRSR-1). A estatstica
de teste, dada por (N 1)V comparada com o valor de Qui-quadrado com p(c-1) graus
de liberdade. Para efetuar os testes de comparaes mltiplas utilizou-se a tcnica
proposta por Katz & McSweeney (1980). Zwick (1985) mostra ainda a relao desse
teste com o trao de Pillai para a anlise multivariada de um delineamento inteiramente
casualizado (one-way) e que, para p = 1, o teste equivale ao de Kruskal-Wallis e para p
= 1 e c = 2, tem-se a aproximao normal do teste de Wilcoxon-Mann-Withney. Da
forma explicitada no referido artigo, apenas possvel obter os valores-p aproximados
atravs do Qui-quadrado e no h nenhuma meno maneira como tratar casos em que
se tm poucas amostras e variveis. Nessas situaes, considerando o caso univariado,
Pontes (2000) indica que a aproximao no adequada. Essa mesma constatao feita
por Schwertman (1982), considerando o caso multivariado.
Outra formulao para esse teste dada em Schwertman (1984), em que
so apresentados dois testes, denominados teste multivariado da mediana para vrias
amostras (MMMT multivariate multisample median test) e teste multivariado da soma
27
prope uma nica estatstica L N = i =1 n i (Ti T )' V 1 (Ti T ) para ambos os testes. O
c
considerando p variveis com medianas individuais dadas por Mdk (k=1,...,p), o vetor de
medianas, denominado mediana componentwise ou simplesmente mediana multivariada,
dado Medc = (Md1, Md2,..., Mdp).
Essa mediana multivariada, formada pelo vetor composto das medianas
individuais, pode no ser adequada devido ao fato de no ser invariante ou afim
invariante sob rotao. Assim, considerando que o vetor de medianas das variveis
tomadas isoladamente no reflete o valor mediano para o caso multivariado, tm-se
buscado formas alternativas de definir uma mediana multivariada. Dentre elas merecem
destaque a mediancenter ou centro-mediano (Gower, 1974) e a mediana de Oja (Oja,
1983).
Dados n pontos com p coordenadas Pi(xi1, xi2, ..., xip), i=1,2,...n,
referentes aos eixos retangulares, Gower (1974) definiu o centro-mediano como sendo o
ponto M(m1, m2, ...,mp) tal que in=1 ( Pi M ) seja mnimo, sendo (Pi M) a distncia
entre MPi, tem-se que in=1 cos i = 0 , ou seja, M invariante para qualquer localizao
{ } { }
k, 0 < < ento E [ ( X 1 ,..., X k , ( P) ) ] = inf E [ ( X 1 ,..., X k , )] define
k
[ ]
= (xi1 ,...xik , ) = inf
{[( X 1 ,..., X k }
, )] 0<<, sendo a soma
mediana amostral. No caso da mediana ( = 1), tem-se algumas vezes um ponto e outras
vezes um conjunto convexo no qual a mediana pode ser selecionada. Assim, a mediana
de Oja (1983), tambm denominada mediana espacial, definida como o ponto M ou os
pontos que minimizam a soma dos volumes dos simplexes formados por k pontos e o
ponto M.
31
que pelo menos r dos valores-p so menores que pr,. Assim, pode-se utilizar tanto um
valor crtico pr, para u( r ) como tambm um nmero crtico mr, de valores-p que so
menores que um nvel fixo, como discutido originalmente por Wilkinson (1951).
Como ui tem distribuio uniforme no intervalo [0,1] ento (Mood et al., 1974, p. 251-
265)
f ur (t ) =
k!
[F (t )]r 1 [1 F (t )]k r f (t ) (18)
(r 1)! (k r )!
Sendo (r , k r + 1) = (r ) (k r + 1) (k + 1) , (k r + 1) = (k r )! ,
(r + k r + 1) = (k + 1) = k ! , (r ) = (r 1)! , f (t ) = I [ 0 ,1 ] (t ) e ainda F (t ) = t para
f ur (t ) = t r 1 (1 t )k r I [0 ,1] (t )
1
(19)
B(r , k r + 1)
Assim, percebe-se que u( r ) tem distribuio Beta, com parmetros r e k-
r+1 e assim, tabelas podem ser obtidas. Esse tipo de procedimento tem a vantagem de
33
no depender de observaes extremas, mas, por outro lado, devido ao fato desse teste
no ter uma regio de aceitao convexa, ele no pode ser utilizado na combinao de
estatsticas de teste que so membros da famlia exponencial a um parmetro.
Procedimentos baseados no mtodo do Qui-quadrado inverso, como o de
Fisher (1932) e o de Fisher ponderado (Good, 1955) so os mais utilizados na
combinao de estudos independentes. Assim, dados k estudos independentes e os
valores-p u1, ...,uk, esse procedimento utiliza a conexo entre as distribuies uniforme e
de Qui-quadrado na qual, dada a varivel aleatria U com distribuio uniforme, ento, a
varivel transformada -2logU tem distribuio de Qui-quadrado com dois graus de
liberdade. Baseando-se no produto dos valores-p, tem-se que, se cada hiptese nula H0i
verdadeira, cada termo do segundo membro da igualdade
T = -2log(u1u2...uk) = -2logu1 - 2logu2 - ... - 2loguk (20)
tem distribuio de Qui-quadrado com dois graus de liberdade e, portanto, a varivel T
tem distribuio de Qui-quadrado com 2k graus de liberdade. Assim, a hiptese nula H0
aritmtica simples dos Zi's, i=1,...,k que tem distribuio assinttica 2 com k-1 graus de
liberdade. Outra possibilidade apontada pelos autores a utilizao de contrastes destes
valores-p. Na mesma direo, Rosenthal & Rubin (1982) discutem testes para
35
R
WR = (23)
R11 R 22
Sob H0, tem-se que nWR tem distribuio assinttica qui-quadrado, com
pxq graus de liberdade. Mier (1997) obtm a normalidade assinttica do teste de
independncia atravs de postos. Gieser & Randles (1997), Tashiken et al. (2003)
apresentam outras verses para testar a independncia entre dois vetores, baseados em
outras de atribuies de postos. Puri & Sen (1971) apresentam tambm testes para
independncia entre pares de vetores.
problemas relacionados aos autovalores da matriz que podem no ser todos positivos.
Mtodos de correo destes autovalores so apresentados.
McArdle & Anderson (2001) mostram que o mtodo proposto por
Legendre & Anderson (1999) no tm erros do tipo I consistentes e propem a utilizao
da subdiviso da variao total na prpria matriz de distncias. Metodologias
semelhantes so propostas por Gower & Krzanowski (1999) e Krzanowski (2002), nos
quais um tratamento matemtico mais adequado apresentado, sob a denominao de
anlise de distncias (analysis of distance).
Anderson (2001) prope um mtodo no-paramtrico baseado em testes
de permutao para a anlise de varincia multivariada, cuja estatstica de teste
multivariada, anloga razo F de Fisher e calculada diretamente de qualquer
distncia simtrica ou matriz de dissimilaridade, com os valores-p obtidos usando
permutaes. De acordo com a autora, em estudos ecolgicos, a necessidade da
utilizao de mtodos no-paramtricos bastante acentuada pelo fato de que as
variveis medidas em geral no seguem distribuies normais. Por outro lado, os testes
da MANOVA no so possveis de serem realizados nos casos em que o nmero de
variveis maior do que o nmero de unidades amostrais, o que no incomum em
aplicaes ecolgicas. Nessa situao tem-se uma matriz de covarincias singular e,
portanto, com varincia generalizada nula, o que impede a aplicao de alguns testes da
MANOVA.
Em Anderson (2001), o mtodo no-paramtrico proposto para testar
diferenas entre grupos em geral baseado em medidas de distncias (dissimilaridade)
entre pares de observaes multivariadas individuais ou seus postos. Uma estatstica
construda para comparar essas distncias entre observaes dentro de um mesmo grupo
versus aquelas em diferentes grupos, seguindo a estrutura conceitual da anlise de
varincia utilizando ento permutaes das observaes para obter a probabilidade
associada com a hiptese nula de no diferena entre grupos. O mtodo no-paramtrico
descrito utiliza a idia de que a soma de quadrados entre os pontos e seus centrides
igual soma de quadrados das distncias entre pontos, dividida pelo nmero de pontos,
ou seja, uma subdiviso aditiva das somas de quadrados pode ser obtida para qualquer
39
1 N 1 N
SSW = d ij2 ij , observando que N o nmero total de observaes e dij a
n i =1 j =i +1
dado por NRP = (cn)! [c! (n! ) c ] , pode crescer rapidamente e assim utiliza-se um
subconjunto aleatrio de todas as possveis permutaes. A nica suposio do teste
que as observaes sejam intercambiveis entre os grupos sob a hiptese nula
verdadeira, ou seja, as observaes so independentes e tm distribuies similares. O
teste proposto sensvel s diferenas de disperso dos pontos, mesmo se as medidas de
locao no diferirem e assim, cuidados devem ser tomados na interpretao dos
resultados dos testes de significncia.
40
substituindo-se a matriz W pela matriz S. Assim, a estatstica de teste de Wilks ser dada
por W(p/s) / S(p/s) e o nmero de graus de liberdade para W(p/s) e S(p/s) so [N - (c - 1)
- (s -1)] e [N - s - 1], respectivamente.
Dempster (1963a, 1963b) descreve o mtodo stepwise de anlise de
varincia multivariada baseado nas variveis principais resultantes da anlise de
componentes principais, generalizando o mtodo delineado por Rao (1952). No primeiro
trabalho apresentada a distribuio terica de mtodos de significncia para dados
multivariados atravs de mtodos geomtricos. No segundo, o mtodo stepwise
descrito e ilustrado, estendendo para a aplicao de combinaes lineares de variveis
resultantes da anlise de componentes principais. Assim, o critrio nico de Wilks para
averiguao de diferenas entre grupos ou tratamentos substitudo por uma sequncia
de critrios, cada um dos quais testado separadamente, pois, segundo Dempster (1963b),
no h razo para acreditar que um simples critrio possa ter tima sensibilidade contra
todas as falhas da hiptese nula devida a diferenas entre os vetores de mdias. A opo
alternativa, na qual substitui-se o critrio nico por testes realizados em cada uma das p
variveis separadamente, no satisfatria, pois em geral os critrios so dependentes e,
portanto, difceis de interpretar na sua forma conjunta. Alm disso, esses critrios so
insensveis a efeitos associados s combinaes lineares das p variveis, mas no
fortemente associados s variveis individuais.
Dempster (1963b) advoga a escolha dos critrios ordenados atravs da
anlise de componentes principais, de tal forma que as primeiras variveis usadas na
ordenao sejam suspeitas, a priori, de terem os maiores desvios da hiptese nula, ou
seja, so mais sensveis ao critrio de teste, e pode-se esperar que o procedimento de
teste seja mais sensitivo do que a estatstica de Wilks (), na qual os pesos dos valores
Pi so iguais, sejam eles sensveis ou no hiptese em estudo. A idia central da anlise
de componentes principais encontrar certas combinaes lineares das p variveis dadas
que so importantes, no sentido de ter maior variabilidade relativa a um critrio padro.
Essas combinaes lineares so denominadas variveis principais e sero consideradas
as anlises de varincias sobre estas novas variveis. Quando as variveis principais so
utilizadas como entrada para o procedimento de teste stepwise, estamos realmente
44
3 METODOLOGIA
3.1 Notao
refere-se ao teste de mdias de vrias populaes numa situao em que vrias variveis
so medidas ao mesmo tempo, ou seja, so feitas inferncias sobre vrias mdias
populacionais. Essa tcnica uma generalizao direta do caso univariado para o caso
em que se tem mais do que uma varivel resposta. Em sua forma mais simples,
consideram-se c grupos ou populaes de onde so extradas amostras aleatrias. Seja ni
o nmero de elementos amostrais extrados da populao i (i = 1,2,...,c). Os valores
observados da varivel X de uma amostra i podem ser escritos na forma de um vetor, ou
seja, X i = ( X i1 , X i 2 ,..., X ini ) .
X (1) ( 2)
X 11 ... X 11
( p)
11
... ... ... ...
X (1) ( 2)
X 1n ... X 1n
( p)
1n1 1 1
X = ... ... ... ...
(1) ( 2) ( p)
X c1 X c1 ... X c1
... ... ... ...
(1) (2) ( p)
X cn X cn ... X cn
c c c
[
X = X (1) X ( 2) ]
X ( p) : vetor de mdias amostrais, em que
1 c ni ( k )
X (k ) = X , k = 1,2,...,p;
N i =1 j =1 ij
1 c nc (k ) ( k ')
S = {s ( kk ' ) } em que s ( kk ') = (k )
( X ij X )( X ij X
( k ')
),
N 1 i =1 j =1
R P = rP { }, em que r
( kk ') ( kk ')
P =
s ( kk ')
( kk ) ( k 'k ')
: matriz simtrica p p de
s s
coeficientes de correlao de Pearson amostrais;
{ }
= ( k ) = ( X ) : vetor de mdias populacionais;
= { ( kk' )
}, em que ( kk' )
=
( kk' )
: matriz simtrica p p
( kk ) ( kk' )
de coeficientes de correlao de Pearson populacionais;
X i i
{
Z = Z 1 , Z 2 ,..., Z p } onde Z i = : vetor p 1 de variveis
ii
padronizadas.
49
3.2.1 Mtodo 1
c) obtm-se o vetor linha V, referentes aos (c-1) grupos e a cada uma das
p variveis, totalizando (c-1)p elementos; os desvios do ltimo grupo
so obtidos a partir dos (c - 1) grupos anteriores; o vetor V tal que
[ ]
V = ( V1' ,...,V p' )' , Vi = R1( k ) ( N + 1 ) / 2 ,..., Rc(k1) ( N + 1 ) / 2 ' ;
(
ncp 1 n 2 1
n 2 c 2 1
).
Para a obteno do valor-p, calcula-se inicialmente a estatstica de teste
para os dados transformados em postos (W0). Permutam-se os elementos amostrais (e
no as variveis) e calcula-se, para cada matriz obtida a partir dessa permutao, o valor
da estatstica Wi. O valor-p obtido simplesmente calculando-se a proporo de valores
da estatstica, obtida a partir das permutaes, que sejam menores ou iguais estatstica
gerada pelos dados originais, ou seja,
Valor-p = # (Wi W0)/ (# permutaes) (28)
No caso de pequenas amostras possvel obter o valor-p exato. No caso
de grandes amostras, alm da aproximao usual atravs da distribuio de Qui-
quadrado, possvel obter os valores-p aproximados, utilizando uma amostra aleatria
das possveis permutaes dos dados e em cada uma delas calcular a estatstica desejada.
Assim, por exemplo, no delineamento inteiramente aleatorizado, so
dadas N amostras, divididas em c grupos com tamanhos n1,..., nc, respectivamente,
54
N = ic=1 ni . O elemento amostral k, e seu respectivo posto, pode ser escrito como um
3.2.2 Mtodo 2
W s + 1 , p + 1 ... W s + 1,s + p
para Z W = ... ... ... . (31)
W s + p , p + 1 ... W s + p ,s + p
Esta forma, que envolve o clculo de um produto de matrizes triplo
parece ser conveniente. Outra maneira de obter a matriz W(p/s) comear com a matriz
completa (Wij) (i,j=1,2,...,s,s+1,...,s+p) e reduzi-la s vezes pelo mtodo de condensao
pivotal comeando pelo elemento W11. Substituindo W por S tem-se a frmula para
calcular a matriz de somas de produtos devido a "desvios da hiptese + erro" para
xs+1,...xs+p quando corrigida para x1,...,xs, representada por S(p/s). Assim, o critrio de
56
teste ser dado por W(p/s) / S(p/s). Os graus de liberdade para W(p/s) sero (n'-q-s) e
para S(p/s) so (n'-s), tal que em notao padro os parmetros associados com so
n=n'-s, p=p e q=q. O teste pode ser realizado normalmente.
Assim, supondo que V1, V2,...,Vp denotam as p variveis dadas e U1,U2,
..., Ur quaisquer combinaes lineares de V1, V2,...,Vp, isto , U = AV em que U' = [U1 U2
... Ur], V'=[V1 V2 ... Vp] e A uma matriz de coeficientes qualquer de dimenso r p .
Utilizando a partio da matriz de disperso total S = B + W, ento ASA', ABA' e AWA'
so, respectivamente, as matrizes de disperso total, entre e dentro de clulas de U1,
U2,...,Ur. Em particular, quando r=1, ocorre a decomposio da anlise de varincia
usual para uma combinao linear qualquer de V1, V2,...,Vp. Segue-se o procedimento de
Gram-Schimidt para a diagonalizao de cada uma das trs matrizes, B, W e S. Assim,
dadas TB, TW e T, matrizes triangulares de dimenso p, com todos os valores da diagonal
unitrios e todos os valores abaixo da diagonal nulos, as matrizes B, W e S podem ser
diagonalizadas de forma a se obterem as matrizes DB = TBSBTB', DW = TWSWTW' e D =
TST'. Denotando os i-simos elementos da diagonal de DB, DW e D por dii(B), dii(W) e dii
respectivamente, (i=1,...,p), possvel calcular Pi=dii(W)/dii, Qi= dii(B)/(dii(B)+dii(W)) e
Ri=(dii(B)+dii(W))/dii. Se qualquer denominador for nulo, os correspondentes Pi, Qi e Ri
devem ser considerados como indefinidos.
O procedimento de diagonalizao feito em p-1 estgios. No primeiro
estgio, substitui-se a matriz de disperso original S por uma matriz S.1 de dimenso p-1
com elementos sij.1= sij - s1is1j/s11 para i=2,3,...,p e j=2,3,...,p. No segundo estgio a
mesma operao repetida em S.1 para a obteno da matriz S.12 de dimenso p-2, cujos
elementos so sij.12 = sij.1 - s2i .1 s2j .1/s22.1, para i=3,...,p; j=3,...,p. Da mesma forma,
calculamos S.123, S.123...(p-1), este ltimo consistindo de um nico elemento. Obtm-se
assim d11, ..., dpp, que so os primeiros elementos diagonais de S, S.1,...,S.12...(p-1),
respectivamente.
No procedimento stepwise geral primeiro escolhe-se um conjunto de
variveis U=AV e depois calculamos as matrizes de disperso total e dentro ASA' e
AWA' para obter d11(W), d22(W), ..., drr(W) e d11, d22, ..., drr. A estatstica obtida atravs do
procedimento stepwise definida por Pi = dii(W)/dii para i=1,2,...,r. Em geral, r=p, mas
57
6i =1 d i2
N
rS = 1 (32)
N3 N
Em (1), d i = Ri( k ) Ri( ) a diferena entre os postos das variveis k e
1 N 2 N + 1
2
(Ri R ) = N 1
(k ) 2 ( ) 2 1 N 2
s =s = Ri N (34)
N 1 i =1 i =1 2
59
N
N ( N + 1)(2 N + 1)
sabendo-se que R
i =1
i
2
= 12 + 2 2 + ... + N 2 =
6
e ainda que a diferena
N ( N + 1)(2 N + 1) N ( N + 1) 2 N ( N 1) 2
que aparece entre chaves equivalente a = ,
6 4 12
tem-se que
N ( N + 1)
s2 = (35)
12
Portanto, a varincia igual para todas as variveis envolvidas, pois todas
elas tm o mesmo conjunto de postos e dada pela frmula (34).
Assim, o coeficiente de correlao de Spearman pode ser escrito como
s ( k) s ( k) 12
rS = = = s ( k) (36)
s ( k ) s ( ) [N ( N + 1] 12 [N ( N + 1)] 12 N ( N + 1)
mas
1 N ( k ) N + 1 ( ) N + 1
s ( k) = Ri 2 Ri 2
N 1 i =1
(37)
1 N ( k ) ( ) N ( N + 1) 2
s ( k) = R i R i (38)
N 1 i =1 4
Substituindo (38) em (36), tem-se
1 12 N
12 N ( N + 1) 2
rS = i i 4 N ( N + 1)
N 1 N ( N + 1) i =1
R ( k ) ( )
R (39)
1 12 N
rS =
N 1 N ( N + 1) i =1
Ri( k ) Ri( ) 3( N + 1) (40)
Por outro lado, partindo da frmula (32), tem-se que
6i =1 d i2
N
(
6i =1 Ri( k ) Ri( )
N
)
2
rS = 1 = 1 (41)
N3 N N ( N 2 1)
1 [
6i =1 Ri( k ) 2 + Ri( ) 2 2 Ri( k ) Ri( )
N
]
rS = ( N 1) (42)
N 1 N ( N + 1)
60
rS =
1
N
(
12 i =1 Ri2 i =1 Ri( k ) Ri( )
N
)
( N 1) (43)
N 1 N ( N + 1)
1 12 N ( N + 1)(2 N + 1)
i =1 Ri( k ) Ri( ) (44)
N
rS = ( N 1)
N 1 N ( N + 1) 6
1 12
R ( k ) Ri( ) 3( N + 1)
N
rS = (45)
N 1 N ( N + 1) i =1 i
Portanto, o coeficiente de correlao de Spearman obtido pela utilizao
dos postos no lugar dos valores originais na frmula do coeficiente de correlao de
Pearson. Verifica-se que:
N N
a) se Ri( k ) = Ri( l ) , i = 1,..., N , tem-se que R
i =1
i
(k )
Ri( ) = Ri2 e,
i =1
1 N ( N + 1)(2 N + 1) N ( N + 1) 2 N ( N + 1)
s ( k) = = = s2, e
N 1 6 4 12
correlacionadas;
b) se Ri( k ) = N Ri( ) + 1, i = 1,..., N , tem-se que rS = 1 tendo em vista
que
[ ]
N N N N N
N ( N + 1) 2 N ( N + 1)(2 N + 1)
= (46)
2 6
1 N ( N + 1) 2 N ( N + 1)(2 N + 1) N ( N + 1)
e s ( k) = = = s 2 (47)
N 1 4 6 12
i = tr ( A) e
n
deles igual a seu determinante, ou seja, i =1
i = det( A) = A .
n
i =1
i = tr ( R) = p
n
respectivamente, pode-se verificar que i =1
e
i = tr ( S ) = p [N ( N + 1)] 12 .
n
i =1
1 N ( N 1)(2 N + 1) 1 N ( N + 1)
2
Vii =
N 1 6 N 6
1 2 N (2 N + 1) 2 N ( N + 1) 1 N ( N + 1)( N 1)
2
Vii = =
N 1 12 N 1 12
N ( N + 1)
Vii = ; (49)
12
c) para a obteno das correlaes a partir das covarincias, basta dividir
pelas razes das varincias das variveis envolvidas; como todas as
varincias so iguais, a relao corr(Xi, Yj)= cov(Xi,Yj)/[N(N+1)/2]
ocorre para todos os elementos das matriz.
Tem-se, portanto, que dada a matriz de varincias e covarincias C,
quadrada e simtrica de dimenso p, formada pelos elementos Cij, os elementos da
matriz de correlao de postos R = {Rij} podem ser obtidos simplesmente multiplicando-
se os elementos Cij por uma constante., ou seja,
12
Rij = C ij (50)
N( N + 1 )
4 RESULTADOS E DISCUSSO
em cujos elementos foram medidas duas variveis e ainda, dois grupos ou tratamentos.
Os postos encontram-se na Tabela 1.
Tabela 2. Teste de Wilks para as configuraes com dois grupos de trs elementos.
Grupos Lambda
Configuraes Variveis 1 1 1 2 2 2 Det(E) de Wilks
1 X1 1 2 3 4 5 6 7.00 0.0357
X2 5 4 6 1 2 3
2 X1 1 2 4 3 5 6 25.67 0.1310
X2 5 4 1 6 2 3
3 X1 1 2 5 3 4 6 137.67 0.7024
X2 5 4 2 6 1 3
4 X1 1 2 6 3 4 5 175.00 0.8929
X2 5 4 3 6 1 2
5 X1 1 3 4 2 5 6 149.33 0.7619
X2 5 6 1 4 2 3
6 X1 1 3 5 2 4 6 149.33 0.7619
X2 5 6 2 4 1 3
7 X1 1 3 6 2 4 5 74.67 0.3810
X2 5 6 3 4 1 2
8 X1 1 4 5 2 3 6 102.67 0.5238
X2 5 1 2 4 6 3
9 X1 1 4 6 2 3 5 177.33 0.9048
X2 5 1 3 4 6 2
10 X1 1 5 6 2 3 4 177.33 0.9048
X2 5 2 3 4 6 1
71
exemplo anterior, a pequena amostra utilizada tem apenas finalidade de observao dos
resultados j que testes nessas condies no resultam em resultados bem definidos em
relao significncia da diferena entre grupos.
Os testes usuais da anlise de varincia multivariada aplicados indicam
contradies em relao aos resultados, havendo significncia ao nvel de 5% para o
teste de Pillai (valor-p = 0,020) e no havendo para o teste de Wilks (valor-p = 0,102).
Essa contradio ocorre tambm quando se consideram os dados permutados e os
resultados dos testes referidos em cada uma das 15 configuraes obtidas. A Tabela 3
indica essa contradio.
Tabela 3. Resultados do teste de Wilks (i) e do teste de Pillai (Vi) para as configuraes
considerando trs tratamentos, cada um com duas repeties.
Configuraes 1 2 3 V
1 0,1669813 0,0677962 0,1097315 0,0012422 1,8782609
2 0,9922407 0,0413551 0,6130312 0,0251553 1,0074534
3 0,9061219 0,0635926 0,9108311 0,0524845 1,0919255
4 0,3269545 0,0002580 0 0 1,8385093
5 0,3549270 0,5272139 0,0414914 0,0077640 1,4869565
6 0,5255346 0,788418 0,1686432 0,0698758 0,9850930
7 0,4455292 0,1905297 0,0146341 0,0012422 1,1329193
8 0,4825949 0,5206334 0,5450897 0,1369565 1,0447205
9 0,7393214 0,9080867 0,8553039 0,5742236 0,4583850
10 0,8382610 0,5329357 0,4004170 0,1788820 1,1006211
11 0,8473542 0,5852524 0,1227417 0,0608696 1,3639752
12 0,3067938 0,6038559 0,0067054 0,0012422 1,2968944
13 0,8914161 0,8244249 0,4327255 0,3180124 0,812422
14 0,9866281 0,9017842 0,0684139 0,0608696 0,991304
15 0,1893414 0,1500961 0,3933978 0,0111801 1,510559
73
(DM), desconforto (DD), distrbio do sono (DS), distrbio psquico (DP) e sade geral
(SG), sendo que esta ltima uma combinao das variveis anteriores. No total, 58
pacientes foram selecionados, 29 de cada sexo, na faixa etria de 21 a 75 anos. Em cada
grupo de sexo, metade dos pacientes foi submetida ao tratamento (reabilitao oclusal
prottica) para DTM e a outra metade, denominada grupo controle, no foi submetido a
nenhum tratamento para DTM.
Os pacientes, submetidos ou no ao tratamento, foram entrevistados antes
do incio do experimento. Aps o tratamento feito apenas em um dos grupos, os
pacientes foram novamente entrevistados. Assim, tem-se dois valores para cada uma das
variveis, uma ao incio e outra ao trmino do experimento. possvel desta forma saber
se houve alterao nas respostas aps a aplicao do tratamento, para o grupo que a ele
se submeteu, comparando-se com o outro grupo, que em nenhum momento foi tratado.
Assim, 28 pacientes foram submetidos reabilitao oclusal prottica,
seja ela com prteses parciais fixa, removveis ou totais, ou ainda uma combinao de
ambos, aps a reabilitao foram novamente submetidos aplicao do QSG. Os outros
30 no foram submetidos reabilitao prottica e responderam novamente ao QSG.
Estes grupos sero denominados tratados e no tratados.
Os resultados apresentados so oriundos das respostas dos pacientes ao
QSG (Questionrio de Sade Geral de Goldberg), utilizado para a determinao dos
distrbios psiquitricos menores e do questionrio do CETASE - Centro de Estudos e
Tratamento das Alteraes Funcionais do Sistema Estomatogntico, da Faculdade de
Odontologia de Piracicaba - Unicamp. Os valores das seis variveis podem variar de
1,000 a 4,000 e a utilizao de testes individuais, baseados na distribuio normal ou t
de Student, pode no ser apropriada. Tambm no caso multivariado, a aplicao dos
testes usuais, baseados nas pressuposies de multinormalidade, homogeneidade das
matrizes de varincias e covarincias e ausncia de pontos discrepantes, pode no ser
correta. A tabela 4 mostra o tamanho das amostras e as mdias de cada uma das
variveis para cada um dos quatro grupos (feminino tratado, feminino no-tratado,
masculino tratado e masculino no-tratado), ao incio e ao final do experimento (antes e
depois).
75
Tabela 4. Tamanho da amostra e mdias, para cada grupo, antes e depois do tratamento.
Tabela 9. Valores de interesse para o teste de W-M-W para comparao entre os grupos
para ambos os sexos- antes.
Tabela 10. Teste W-M-W entre tratados e no tratados, ambos os sexos - Variveis
ALT_zz.
Tabela 11. Teste W-M-W entre tratados e no tratados sexo feminino - Variveis
ALT_zz.
Tabela 12. Valores de interesse para o teste W-M-W entre tratados e no tratados sexo
masculino - Varivel ALT_zz.
Tabela 13. Valores de interesse para o teste W-M-W entre os sexos masculino e
feminino e valores-p Varivel ALT_zz.
Tabela 15. Resultados dos testes de Pillai e de Wilks para os dados transformados em
postos e dados originais variveis ALT_zz e rALT_zz.
Variveis Testes Valor da Estatstica F Valor-p
ALT_zz Trao de Pillai 0,51199 4,826 0,004
Lambda de Wilks 0,48801 4,826 0,004
rALT_zz Trao de Pillai 0,54471 3,845 0,011
Lambda de Wilks 0,45529 3,845 0,011
84
#(calci i)
I i ou V Valores-p ou Valores-p
(Distr.Beta) #(calci V) (Programa)
1 0,7577849 0,0067 127 0,0032
2 0,8509555 0,0424 1069 0,0267
3 0,8825422 0,0801 3024 0,0756
4 0,9743207 0,4342 17359 0,4331
5 0,9822911 0,5260 21743 0,5436
Trao de Pillai 0,5447122 0,0110 256 0,0064
88
4 CONCLUSES
REFERNCIAS BIBLIOGRFICAS
ARNOLD, H.J. Permutation support for multivariate techniques. Biometrika, v.51, n.1,
p.65-70, 1964.
ATKINSON, A.C.; MULIRA H.-M. The stalactite plot for the detection of multivariate
outliers. Statistics and Computing, v.3, p.27-35, 1993.
BELL, C.B.; SEN, P.K. Randomization procedures. In: KRISHNAIAH, P.R.; SEN, P.K.
(Ed.) Handbook of statistics. New York: Elsevier Science, 1984. v.4, cap.1, p. 1-29.
BHAPKAR, V.P. Univariate and multivariate multisample location and scale tests. In:
KRISHNAIAH, P.R.; SEN, P.K. (Ed.). Handbook of statistics. New York: Elsevier
Science, 1984. v.4, cap.2, p. 31-62.
BOYK, R.J. Spectral models for covariance matrices. Biometrika, v.89, p.159-182,
2002.
BROWN, B.M. Statistical uses of the spatial median. Journal of the Royal Statistical
Society, Series B, v.45, n.1, p.25-30, 1983.
CONOVER, W.J. Practical nonparametric statistics. 3.ed. New York: John Wiley,
1999. 584 p.
DIETZ, E.J. Bivariate nonparametric tests for the one-sample location problem. Journal
of the American Statistical Association, v.77, n.377, p.163-169, 1982.
DIETZ, E.J.; KILLEEN, T.J. A nonparametric multivariate test for monotone trend with
pharmaceutical applications. Journal of the American Statistical Association,
v.78, n.373, 1981.
EDGINGTON, E.S. Randomization tests. 3.ed. New York: Marcel Dekker, 1995.
409p.
97
FISHER, R.A. Statistical methods for research workers. 4.ed. Edinburgh: Oliver &
Boyd, 1932. 307 p.
FLURY, B.N. Common principal components and related multivariate models. New
York: John Wiley, 1988. 258p.
FRYER, J.G. On the nonparametric tests of David and Fix for the bivariate two-sample
location problem. Journal of the American Statistical Association, v.65, n.331,
p.1297-1307, 1970.
GOOD, I.J. On the weighted combination of significance tests. Journal of the Royal
Statistical Society, Series B, v.17, p.264-265, 1955.
GOWER, J.C. The mediancentre. Applied Statistics, v.23, n.3, p.466-470, 1974.
HUH, M.-H.; JHUN, M.. Random permutation testing in multiple linear regression.
Communications in Statistics: Theory and Methods, v.30, n.10, p.2023-2032,
2001.
KHATTREE, R.; NAIK, D.N. Applied multivariate statistics with SAS software.
2.ed. Carey: Wiley Interscience; SAS Institute's Book by Users, 1996. 338 p.
MALKOVICH, J.F.; AFIFI, A.A. On tests for multivariate normality. Journal of the
American Statistical Association, v.68, p.176-179, 1973.
MARDIA, K.V. The effect of nonnormality on some multivariate tests and robustness to
nonnormality in the linear model. Biometrika, v.58, n.1, p.105-121, 1971.
100
MARDIA, K.V.; KENT, J.T.; BIBBY, J.M. Multivariate analysis. London: Academic
Press, 1979. 521p.
MIELKE, P.W.; IYER, H.K. Permutation techniques for analyzing multi-response data
from randomization block experiments. Communications in Statistics: Theory and
Methods. v.11, n.13, p.1427-1437, 1982.
MOOD, A.M.; GRAYBILL, F.A.; BOES, D.C. Introduction to the theory of statistics.
3.ed. Tokyo: McGraw-Hill Kogakusha, 1974. 564 p.
MTTNEN, J.; OJA, H. Multivariate spatial sign and rank methods. Journal of
Nonparametric Statistics, v.5, p.201-213, 1995.
MUNDRY, R.; FISCHER, J. Use of statistical programs for nonparametric tests of small
samples often leads to incorrect p values: examples from Animal Behaviour. Animal
Behaviour, v.56, p.256-259, 1998.
NADAR, M.; HETTMANSPERGER, T.P.; OJA, H. The asymptotic matrix of the Oja
median. Statistics & Probability Letters, v.64, p.431-442, 2003.
OJA, H.; NYBLOM, J. Bivariate sign tests. Journal of the American Statistical
Association, v.84, n.405, 1989.
OLLILA, E.; OJA, H.; CROUX, C. The affine equivariant sign covariance matrix:
asymptoctic behavior and efficiencies. Journal of Multivariate Analysis, v.87,
p.328-355, 2003.
PARK, H-I; NA, J-H.; DESU, M.M. Nonparametric one-sided tests for multivariate
data. Sankhy Series B, v.63, n.3, p.286-297, 2001.
PETERS, D.; RANDLES, R.H. A multivariate signed-rank test for the one-sample
location problem. Journal of the American Statistical Association, v.85, n.410,
p.552-557, 1990.
PETERS, D.; RANDLES, R.H. A bivariate signed rank test for the two-sample location
problem. Journal of the Royal Statistical Society, Series B, v.53, n.2, p.493-504,
1991.
PURI, M.L.; SEN, P.K. Nonparametric confidence regions for some multivariate
location problems. Journal of the American Statistical Association, v.63, p.1373-
1378, 1968.
103
PURI, M.L.; SEN, P.K. Nonparametric methods in multivariate analysis. New York:
John Wiley, 1971. 440p.
RANDLES, R.H.; PETERS, D. Multivariate rank tests for the two-sample location
problem. Communications in Statistics: Theory and Methods, v.19, n.11, p.4225-
4238, 1990.
RAO, C.R. Advanced statistical methods in biometric research. New York: John
Wiley, 1952. 390p.
RENCHER, A.C. Methods of multivariate analysis. New York: John Wiley, 1995.
627p.
SCHWERTMAN, N.C. A Monte Carlos study of the LN statistic for the multivariate
nonparametric median and rank sum tests for two populations. Communications in
Statistics - Simulation and Computation, v.11, n.6, p.667-676, 1982.
104
SCHWERTMAN, N.C. Multivariate median and rank sum tests. In: KOTZ, S.;
JOHNSON, N.L.; READ, C.B. (Ed.). Encyclopedia of statistical sciences. New
York: Wiley-Interscience, 1984. v.6, p.85-88.
SEN, P.K. On nonparametric simultaneous confidence regions and tests for the one
criterion analysis of variance problem. Annals of the Institute of Statistical
Mathematics, v.18, p.319-336, 1966.
SEN, P.K. Nonparametric tests for multivariate interchangeability. Part two: the problem
of MANOVA in two-way layouts. Sankhy - Series A, v.31, p.145-156, 1969.
SHAPIRO, S.S.; WILK, M.B. An analysis of variance test for normality (complete
samples). Biometrika, v.52, p.591-611, 1965.
SHAPIRO, S.S.; WILK, M.B.; CHEN, H.J. A comparative study of various tests for
normality. Journal of the American Statistical Association, v.63, p.1343-1372,
1968.
SYRJALA, S.E. A statistical test for a difference between the spatial distributions of two
populations. Ecology, v.77, n.1, p.75-80, 1996.
105
SZKELY, G.J.; RIZZO, M.L. A new test for multivariate normality. Journal of
Multivariate Analysis, v.93, n.1, p.58-80, 2005.
TASHIKEN, S.; KANKAINEN, A.; OJA, H. Sign test of independence between two
random vectors. Statistics & Probability Letters, v.62, p.9-21, 2003.
THOMPSON, G.L. On intercomponent rank tests for the bivariate two-sample location
model. Journal of Statistical Computation and Simulation, v.43, p.103-116,
1992.
UM, Y.; RANDLES, R.H. Nonparametric tests for the multivariate multi-sample
location problem. Statistica Sinica, v.8, p.801-812, 1998.
VISURI, S.; KOIVUNEN, V.; OJA, H. Sign and rank covariance matrices. Journal of
Statistical Planning and Inference, v.91, p.557-575, 2000.