You are on page 1of 22

Anlise de Correspondncias Mltiplas

Ana Amaro, 2010

Anlise em Componentes Principais


Planetas Escolas Americanas Indicadores de desenvolvimento Actividades de um conjunto de americanos Alimentao nos estados americanos

Agrupar Caracterizar

Interaction Plot: EMPREG x FUMAR 40 35 30 25 Frequencies 20 15 10 5 0 -5 No Fraco FUMAR Mdio Forte EMPREG Gest Sn EMPREG Gest Jr EMPREG Tcn Sn EMPREG Tcn Jr EMPREG Administ

Lembram-se ?

Anlise de contingncia

Anlise de correspondncias Table) Input Table (Rows x Columns): 9 x 9 (Burt mltiplas


2,5 Dimension 2; Eigenvalue: ,55004 (15,72% of Inertia) 2,0 1,5 1,0 0,5 0,0 -0,5 -1,0 -1,5 -1,5
Ana Amaro, 2008

2D Plot of Column Coordinates; Dimension: 1 x 2

EMPREG:Gest Jr FUMAR:Forte EMPREG:Gest Sn

FUMAR:Mdio EMPREG:Tcn Jr

FUMAR:No EMPREG:Tcn Sn

EMPREG:Administ FUMAR:Fraco

-1,0

-0,5

0,0
Estatstica II

0,5

1,0

1,5
2007/08

2 Dimension 1; Eigenvalue: ,63671 (18,19% of Inertia)e 3 anos da Lic. em Gesto

O que so ? Contextos ?
A. Contingncia
Ajuda a perceber se duas variveis QUALITATIVAS esto relacionadas uma tcnica que aceita testes estatsticos (inferncia; graus de confiana nas decises)

A. Correspondncias Mltiplas
Ajuda a perceber a forma como as variveis e os seus valores esto associados... (estruturas de associao) uma tcnica exploratria...

Anlise de contingncia
H0: No h relao entre a CATEGORIA e o ACTO DE FUMAR ou

H0: as duas variveis so INDEPENDENTES

Se fossem independentes o perfil de distribuio dos inquiridos deveria ser o seguinte:


Interaction Plot: FUMAR x EMPREG-cod 40 35 30 25 Frequencies

Comparando as duas tabelas...


linhas colunas

20 15 10 5 0 FUMAR No FUMAR Fraco FUMAR Mdio FUMAR Forte

Q=


i=1 j01

(esp ij obs ij ) esp ij

2 Se H0 for verdade Q ~ (linhas 1)( colunas 1)

-5 Gest Tcn Sn Tcn Jr Administ EMPREG-cod

E a Anlise de Correspondncias M... o que ?


Tcnica DESCRITIVA/EXPLORATRIA com a vocao de analisar TABELAS de dupla entrada (por ex. uma tabela de contingncia) que contenham CONTAGENS (correspondncias) entre linhas e colunas

Tabela de Burt

complexidade

Empreg e Fumar

Anlise de contingncia

Interaction Plot: EMPREG-cod x FUMAR 40 35 30 25 Frequencies 20 15 10 5 0 -5 No Fraco FUMAR Mdio Forte EMPREG-cod Gest EMPREG-cod Tcn Sn EMPREG-cod Tcn Jr EMPREG-cod Administ

Empreg e Fumar

Anlise de contingncia

Os Tcn Sn tendem mais a No fumar Os Tecn Jr tendem a fumar mais Mdio e Fraco Os Gest fumam mais FORTE do que se esperaria
Interaction Plot: EMPREG-cod x FUMAR Interaction Plot: EMPREG-cod FUMAR Interaction Plot: EMPREG-cod x x FUMAR Interaction Plot: EMPREG-cod x x FUMAR Interaction Plot: EMPREG-cod FUMAR

Frequencies Frequencies Frequencies Frequencies Frequencies

40 40 40 40 40 35 35 35 35 35 30 30 30 30 30 25 25 25 25 25 20 20 20 20 20 15 15 15 15 15 10 10 10 10 10 5 5 5 55 0 0 0 00 -5 -5 -5 -5 -5

No No No No No

Fraco Fraco Fraco Fraco Fraco

Mdio Mdio FUMAR Mdio Mdio Mdio FUMAR FUMAR FUMAR FUMAR

Forte Forte Forte Forte Forte

EMPREG-cod Gest EMPREG-cod EMPREG-cod EMPREG-cod EMPREG-cod EMPREG-cod Gest Gest Gest Gest Sn Tcn EMPREG-cod EMPREG-cod EMPREG-cod EMPREG-cod EMPREG-cod Tcn Sn Tcn Sn Tcn Sn Tcn Sn Tcn Jr EMPREG-cod EMPREG-cod EMPREG-cod EMPREG-cod EMPREG-cod Tcn Jr Tcn Jr Tcn Jr Tcn Jr Administ EMPREG-cod EMPREG-cod EMPREG-cod Administ Administ Administ

Anlise de correspondncias
Objectivo: explorar a ESTRUTURA das variveis QUALITATIVAS consideradas na tabela!
Em tudo, muito semelhante ACP
Nasce nos anos 60 em Frana com a Biologia

2D Plot of Column Coordinates; Dimension: 1 x 2 Input Table (Rows x Columns): 8 x 8 (Burt Table) 2,0 Dimension 2; Eigenvalue: ,54982 (18,33% of Inertia) EMPREG-cod:Gest FUMAR:Forte

1,5

1,0

ACM

0,5 FUMAR:No EMPREG-cod:Tcn Sn

0,0

FUMAR:Mdio EMPREG-cod:Tcn Jr

-0,5 FUMAR:Fraco

EMPREG-cod:Administ

-1,0

-1,5 -1,5

-1,0

-0,5

Dimension 1; Eigenvalue: ,63328 (21,11% of Inertia)

2 e 3 anos da Lic. em Gesto 2007/08

0,0

0,5

1,0

1,5

Anlise de correspondncias
Objectivo: explorar a ESTRUTURA das variveis QUALITATIVAS consideradas na tabela!
Em tudo, muito semelhante ACP
Nasce nos anos 60 em Frana com a Biologia

Os Tcn Sn tendem mais a No fumar Os Tecn Jr tendem a fumar mais Mdio e Fraco Os Gest fumam mais FORTE do que se esperaria
2D Plot of Column Coordinates; Dimension: 1 x 2 Input Table (Rows x Columns): 8 x 8 (Burt Table) 2,0 Dimension 2; Eigenvalue: ,54982 (18,33% of Inertia) EMPREG-cod:Gest FUMAR:Forte 1,5

1,0

ACM

0,5 FUMAR:No EMPREG-cod:Tcn Sn

0,0

FUMAR:Mdio EMPREG-cod:Tcn Jr

-0,5 FUMAR:Fraco

EMPREG-cod:Administ

-1,0

-1,5 -1,5

-1,0

-0,5

Dimension 1; Eigenvalue: ,63328 (21,11% of Inertia)

2 e 3 anos da Lic. em Gesto 2007/08

0,0

0,5

1,0

1,5

Total Inertia=3,0

Dim.1 e Dim.2 coordenadas no novo espao (equivalente s CPs)


Dimension 2; Eigenvalue: ,54982 (18,33% of Inertia)

2D Plot of Column Coordinates; Dimension: 1 x 2 Input Table (Rows x Columns): 8 x 8 (Burt Table) 2,0 EMPREG-cod:Gest 1,5 FUMAR:Forte

Mass distribuio das frequncias TOTAIS (soma=1) Quality


Razo entre o quadrado da distncia entre a varivel/categoria e a origem no espao de duas dim e o mm valor no espao c o n. de dim mximo. (% de

1,0

0,5 FUMAR:No EMPREG-cod:Tcn Sn 0,0 FUMAR:Mdio EMPREG-cod:Tcn Jr -0,5 FUMAR:Fraco EMPREG-cod:Administ

variabilidade relativa varivel/categoria que as 2 dimenses representam)(o mx 1)

-1,0

Inertia equivalente razo entre a estatstica Quiquadrado e o n. total de observaes. relative parcial
(distribuio da variao pelas variveis/categorias) (soma=1)

-1,5 -1,5

-1,0

-0,5

0,0

0,5

1,0

1,5

Dimension 1; Eigenvalue: ,63328 (21,11% of Inertia)

Inertia/ Inertia/Dim distrib. da inrcia pela dim. Soma=1 Cosine2/Dim Cosine2/Dim distrib. da qualidade pela dim. Soma destes valores para a mesma varivel/categoria igual qualidade

Total Inertia=3,0

Dim.1 e Dim.2 coordenadas no novo espao (equivalente s CPs)


Dimension 2; Eigenvalue: ,54982 (18,33% of Inertia)

2D Plot of Column Coordinates; Dimension: 1 x 2 Input Table (Rows x Columns): 8 x 8 (Burt Table) 2,0 EMPREG-cod:Gest 1,5 FUMAR:Forte

Mass distribuio das frequncias TOTAIS (soma=1) Quality


Razo entre o quadrado da distncia entrereduzido de QUALIDADE Um valor a varivel/categoria e a origem no espao de duas dim e o mm valor no espao significa que as DUAS dimenses NO c o n. de dim mximo. (% de

1,0

0,5 FUMAR:No EMPREG-cod:Tcn Sn 0,0 FUMAR:Mdio EMPREG-cod:Tcn Jr -0,5 FUMAR:Fraco EMPREG-cod:Administ

representam bem a categoria/varivel variabilidade relativa Mx=1 (para obter melhor QUALIDADE varivel/categoria que as 2 temos de aumentar o n de dimenses) dimenses representam)(o mx 1)

-1,0

Inertia equivalente razo Dimension 1; Eigenvalue: ,63328 (21,11% of Inertia) entre a estatstica Quiquadrado proporo da variao total explicada A INRCIA corresponde da variao e o n. total de 1) Relative - distribuio Inertia/Dim distrib. da inrcia pela dim. Soma=1 observaes. Inertia/ pelas originais SOMA=1 2) /dim varincia da varivel original que contribui da qualidade pela dim. relative parcial Cosine2/Dim Cosine2/Dim distrib. para a Dim CUIDADO da variao importncia (QUALIDADE)destescontribuio que feita pelo Cosine2 no mede a pelas (distribuio Soma dessa valores para a mesma varivel/categoria (equivalente a variveis/categorias) (soma=1) uma correlao) CosineDim1+CosineDim2=Quality igual qualidade

-1,5 -1,5

-1,0

-0,5

0,0

0,5

1,0

1,5

Total Inertia=3,0

Dim.1 e Dim.2 coordenadas no novo espao (equivalente s CPs)


2D Plot of Column Coordinates; Dimension: 1 x 2

2D Plot of Column Coordinates; Dimension: 1 x 2 Input Table (Rows x Columns): 8 x 8 (Burt Table) 2,0 Dimension 2; Eigenvalue: ,54982 (18,33% of Inertia) EMPREG-cod:Gest 1,5
Interaction FUMAR:Forte Plot: EMPREG-cod x FUMAR 40 35

Dimension 2; Eigenvalue: ,54982 (18,33% of Inertia)

Mass distribuio das frequncias TOTAIS (soma=1)


Input Table (Rows x Columns): 8 x 8 (Burt Table) 2,0 1,5 EMPREG-cod:Gest FUMAR:Forte

1,0
30

Quality
1,0

representam bem a categoria/varivel EMPREG-cod:Tcn Jr variabilidade relativa EMPREG-cod:Administ -0,5 Mx=1 (para obter melhor QUALIDADE varivel/categoria que as 2 temos de aumentar o n de dimenses) FUMAR:Fraco dimenses representam)(o mx 1) -1,0
-1,5 -1,5 -1,0 -0,5 0,0 0,5

Razo entre o quadrado da distncia entrereduzido de QUALIDADE Um valor a varivel/categoria e a origem 0,5 no espao de duas dim e o mm valor no espao FUMAR:No significa que as DUAS dimenses NO EMPREG-cod:Tcn Sn FUMAR:Mdio c o 0,0 de dim mximo. (% de n.

0,5
Frequencies

25 20 15 10 5

FUMAR:No EMPREG-cod:Tcn Sn FUMAR:Mdio EMPREG-cod:Tcn Jr EMPREG-cod:Administ FUMAR:Fraco


EMPREG-cod Gest EMPREG-cod Tcn Sn EMPREG-cod Tcn Jr EMPREG-cod 1,0 Administ

0,0

-0,5

-1,0
0

Inertia equivalente razo Dimension 1; Eigenvalue: ,63328 (21,11% of Inertia) entre a estatstica Quiquadrado proporo da variao total explicada A INRCIA corresponde da variao e o n. total de 1) Relative - distribuio Inertia/Dim distrib. da inrcia pela dim. Soma=1 observaes. Inertia/ pelas originais SOMA=1 2) /dim varincia da varivel original que contribui da qualidade pela dim. relative parcial Cosine2/Dim Cosine2/Dim distrib. para a Dim CUIDADO da variao importncia (QUALIDADE)destescontribuio que feita pelo Cosine2 no mede a pelas (distribuio Soma dessa valores para a mesma varivel/categoria (equivalente a variveis/categorias) (soma=1) uma correlao) CosineDim1+CosineDim2=Quality igual qualidade
1,0 1,5 Dimension 1; Eigenvalue: ,63328 (21,11% of Inertia) FUMAR

-1,5 -1,5

-5

-1,0 No

-0,5 Fraco

0,0 Mdio

0,5 Forte

1,5

Total Inertia=3,0

Os Tcn Sn tendem mais a No fumar Os Gest fumam mais FORTE do que se esperaria Os Tecn e Dim.2 coordenadas Dim.1 Jr tendem a fumar mais Mdio e Fraco
no novo espao (equivalente s CPs)
2D Plot of Column Coordinates; Dimension: 1 x 2

2,0 Dimension 2; Eigenvalue: ,54982 (18,33% of Inertia)

Dimension 2; Eigenvalue: ,54982 (18,33% of Inertia)

Mass distribuio das frequncias TOTAIS (soma=1)


Input Table (Rows x Columns): 8 x 8 (Burt Table) 2,0 1,5 EMPREG-cod:Gest FUMAR:Forte

1,5

40 35

1,0
30

Um valor reduzido de QUALIDADE significa que as Input Table (Rows x Columns): 8 x 8 (Burt Table) DUAS dimenses NO EMPREG-cod:Gest representam bem a Interaction FUMAR:Forte Plot: EMPREG-cod x FUMAR categoria/varivel Mx=1 (para obter melhor QUALIDADE temos de aumentar o n de dimenses)
2D Plot of Column Coordinates; Dimension: 1 x 2 FUMAR:No EMPREG-cod:Tcn Sn FUMAR:Mdio EMPREG-cod:Tcn Jr EMPREG-cod:Administ FUMAR:Fraco
EMPREG-cod Gest EMPREG-cod Tcn Sn EMPREG-cod Tcn Jr EMPREG-cod 1,0 Administ

Quality
1,0

Razo entre o quadrado da distncia entre a varivel/categoria e a origem 0,5 no espao de duas dim e o mm valor no espao FUMAR:No EMPREG-cod:Tcn Sn FUMAR:Mdio c o 0,0 de dim mximo. (% de n.

0,5
Frequencies

25 20 15 10 5

0,0

EMPREG-cod:Tcn Jr variabilidade relativa EMPREG-cod:Administ -0,5 varivel/categoria que as 2 FUMAR:Fraco dimenses representam)(o mx 1) -1,0

-0,5

-1,0
0

Inertia equivalente razo Dimension 1; Eigenvalue: ,63328 (21,11% of Inertia) entre a estatstica Quiquadrado proporo da variao total explicada A INRCIA corresponde da variao e o n. total de 1) Relative - distribuio Inertia/Dim distrib. da inrcia pela dim. Soma=1 observaes. Inertia/ pelas originais SOMA=1 2) /dim varincia da varivel original que contribui da qualidade pela dim. relative parcial Cosine2/Dim Cosine2/Dim distrib. para a Dim CUIDADO da variao importncia (QUALIDADE)destescontribuio que feita pelo Cosine2 no mede a pelas (distribuio Soma dessa valores para a mesma varivel/categoria (equivalente a variveis/categorias) (soma=1) uma correlao) CosineDim1+CosineDim2=Quality igual qualidade
-1,0 -0,5 0,0 0,5 1,0 1,5 Dimension 1; Eigenvalue: ,63328 (21,11% of Inertia) FUMAR

-1,5 -1,5

-1,5 -1,5

-5

-1,0 No

-0,5 Fraco

0,0 Mdio

0,5 Forte

1,5

Interaction Plot: EMPREG-cod x FUMAR

Total Inertia=3,0
40 35 30 25 Frequencies 20 15 10 5 0 -5 No Fraco FUMAR Mdio Forte EMPREG-cod Gest EMPREG-cod Tcn Sn EMPREG-cod Tcn Jr EMPREG-cod Administ

2D Plot of Column Coordinates; Dimension: 1 x 2 Input Table (Rows x Columns): 8 x 8 (Burt Table) 2,0 Dimension 2; Eigenvalue: ,54982 (18,33% of Inertia) EMPREG-cod:Gest 1,5 FUMAR:Forte

3D Plot of Column Coordinates; Dimension: 1 x 2 x 3 Input Table (Rows x Columns): 8 x 8 (Burt Table)

EMPREG-cod:Administ

1,0

EMPREG-cod:Gest FUMAR:MdioFUMAR:No

0,5 FUMAR:No EMPREG-cod:Tcn Sn 0,0 FUMAR:Mdio EMPREG-cod:Tcn Jr -0,5 FUMAR:Fraco EMPREG-cod:Administ

EMPREG-cod:Tcn Sn FUMAR:Forte EMPREG-cod:Tcn Jr FUMAR:Fraco

-1,0

-1,5 -1,5

-1,0

-0,5

0,0

0,5

1,0

1,5

Dimension 1; Eigenvalue: ,63328 (21,11% of Inertia)

Quais os impactes (+ e -) do aumento do nmero de dimenses ?

Sugestes
ANTES
Seleccionar CUIDADOSAMENTE as variveis
Tabelas de frequncias!
Balancear as frequncias Representatividade (Mass)

Formular o problema: QUAL A QUESTO EM ANLISE


Sei que estou a tentar encontrar ASSOCIAES

DEPOIS
Com 2 dimenses
ANALISAR
Mapa de correspondncias Inrcias e correlaes (Cosine2)

Pode sempre espreitar-se a 3 dimenso...

Talvez melhorar um pouco...

Tpicos para a interpretao dos mapas


Independentemente da sua localizao, se uma categoria no est bem representada (massa) pode enganar. Deve ser retirada ou reagrupada

Tpicos para a interpretao dos mapas


Independentemente da sua localizao, se uma categoria no est bem representada (massa) pode enganar. Deve ser retirada ou reagrupada... As categorias de uma nuvem que estejam prximas umas das outras MAS longe da origem (0,0) esto associadas. As categorias prximas da origem (0,0) no se podem considerar associadas.
2D Plot of Column Coordinates; Dimension: 1 x 2 Input Table (Rows x Columns): 8 x 8 (Burt Table) 2,0 Dimension 2; Eigenvalue: ,54982 (18,33% of Inertia) EMPREG-cod:Gest 1,5 FUMAR:Forte

1,0

0,5 FUMAR:No EMPREG-cod:Tcn Sn 0,0 FUMAR:Mdio EMPREG-cod:Tcn Jr -0,5 FUMAR:Fraco EMPREG-cod:Administ

-1,0

-1,5 -1,5

-1,0

-0,5

0,0

0,5

1,0

1,5

Dimension 1; Eigenvalue: ,63328 (21,11% of Inertia)

Tpicos para a interpretao dos mapas


Independentemente da sua localizao, se uma categoria no est bem representada (massa) pode enganar. Deve ser retirada ou reagrupada... As categorias de uma nuvem que estejam prximas umas das outras MAS longe da origem (0,0) esto associadas. As categorias prximas da origem (0,0) no se podem considerar associadas. As categorias que no contribuam de modo relevante para a inrcia de cada dimenso so equivalentes ao perfil mdio (portanto sem caractersticas de diferenciao) Uma categoria contribui de modo relevante para a inrcia de uma dada dimenso de duas formas: pela contribuio em varincia e pela correlao com que est associada dimenso.

Concluso
Muito interessante Pode ser muito til No sujeita a testes estatsticos EXPLORATRIA!!!!! S pode ser utilizada com MUITO CUIDADO

You might also like