You are on page 1of 6

Porque é o Diário de Notícias o preferido dos leitores *

José Firmino da Costa (1400433), Mestrado em Estatística, Matemática e Computação, Universidade


Aberta

Como se pode ver em (1), as CP são formadas a partir das


Sumário — Este trabalho apresenta uma investigação acadé-


mica sobre as motivações que fundamentam a preferência de um variáveis medidas por um processo de combinação linear que
entre vários jornais diários portugueses. A investigação baseia- maximiza 𝑉𝑎𝑟(𝐶𝑃), (2), com a restrição 𝑎𝑖′ ∙ 𝑎𝑖 = 1 e para a
se em 100 respostas a um questionário com 42 questões. A análise segunda e seguintes CP com a restrição adicional (3) = 0, como
utiliza “IBM® SPSS® Statistics version 22” e aplica o método indicado em [1, p. 431] e [2, p. 263].
“Componentes Principais” de “Análise Fatorial Exploratória”.
𝑉𝑎𝑟(𝐶𝑃𝑖 ) = 𝑎𝑖′ Σ𝑎𝑖 𝑖 = 1,2, ⋯ , 𝑝 (2)
I. INTRODUÇÃO
𝐶𝑜𝑣(𝐶𝑃𝑖, 𝐶𝑃𝑘 ) = 𝑎𝑖′ Σ𝑎𝑘 𝑖, 𝑘 = 1,2, ⋯ , 𝑝, 𝑖 ≠ 𝑘 (3)
A pesquisa em Ciências Sociais debruça-se naturalmente
sobre aspetos do comportamento que constituem variáveis A Fig. 1 [3] ilustra o método para a definição de CP. Como
complexas. Na maioria das situações a caraterização dessas indica Marôco [4, p. 446], a projeção das observações x1m, x2m
variáveis não pode ser feita de uma forma direta, antes abor- nos eixos de máxima variância (Y1,Y2) são dadas por 𝐶1 =
dada através de facetas distintas cuja conjugação revela a causa 𝑐𝑜𝑠(𝜃)𝑥1 + 𝑠𝑒𝑛(𝜃)𝑥2 , que é uma combinação linear de x1m e
real dos padrões de comportamento. Questões como “ami- x2m. A escolha de CP consiste, portanto, na determinação do θ
zade” ou “inteligência” não são representáveis diretamente que maximize a variância no eixo resultante.
num índice e a preferência por uma determinada marca de vi-
nho resulta da combinação de fatores diversos como a emba- A aplicação deste método tem vários pressupostos, nomeada-
lagem, o preço, o corpo, o teor alcoólico, vários componentes mente [5]:
gustativos, a reputação, etc. Daqui resulta a necessidade de re-  As variáveis devem ter escalas numéricas contínuas ou de
colher dados de um conjunto vasto de variáveis o que torna intervalo. Como muita da informação recolhida em ciên-
complexo o processo de análise. cias sociais é categórica foram criados métodos de escalo-
Como solução foram desenvolvidos métodos de “Redução namento que atribuem valores numéricos a cada categoria
de Dimensão (RD)”, sendo os principais a “Análise em Com- possibilitando o recurso a ACP [4, p. 450].
ponentes Principais (ACP)” e a “Análise Fatorial Exploratória  As amostras devem ser aleatórias com um mínimo de 10
(AFE)”. Este trabalho começa por caraterizar sucintamente os observações por VI e pelo menos 100 observações.
dois métodos para seguidamente debater a aplicação de AFE a
uma situação de RD nas respostas a um inquérito sobre a pre-  As variáveis de interesse devem apresentar distribuição
ferência por um jornal diário e formular conclusões. normal multivariada. Cada par de VI deve apresentar dis-
tribuição normal bivariada.
II. MÉTODOS
 ACP assume a inexistência de valores anómalos.
A. Análise em Componentes Principais
Podemos caraterizar a ACP como uma ferramenta estatís-
tica utilizada para reduzir um conjunto numeroso de variáveis
de interesse (VI) num pequeno número de componentes que,
no entanto, ainda contém a maioria das informações do con-
junto inicial. Os seus objetivos são a interpretação dos dados e
a simplificação (redução) da estrutura dos dados. [1, p. 430]
As componentes principais (CP) são variáveis não correla-
cionadas (ortogonais), independentes, e são calculadas por va-
lor decrescente da variância original que incorporam.
CP1 = 𝑎11 𝑋1 + 𝑎12 𝑋2 + ⋯ + 𝑎1𝑝 𝑋𝑝
CP2 = 𝑎21 𝑋1 + 𝑎22 𝑋2 + ⋯ + 𝑎2𝑝 𝑋𝑝
(1)

CP𝑝 = 𝑎𝑝1 𝑋1 + 𝑎𝑝2 𝑋2 + ⋯ + 𝑎𝑝𝑝 𝑋𝑝

A primeira CP captura a maioria da variabilidade, a se-


gunda a maioria do remanescente e assim sucessivamente.
Figura 1 - Representação Geométrica de CP [3]

*Relatório da Atividade 3 (Trabalho Individual) da Unidade Curricular de


Análise Dados Multivariados e Aplicações (22002), 2014/2015
B. Análise Fatorial Esta transformação pretende obter um número de vetores or-
Elizabeth Reis não considera AFE como distinta de ACP togonais, com coeficientes não nulos apenas para um número
[2, p. 265]. No entanto esta opinião não é consensual, outros reduzido de variáveis e sem sobreposições. Apesar deste resul-
autores como Johnson [1] ou Marôco [4], embora reconhe- tado ser difícil de alcançar, a redução dos valores sobrepostos
cendo pontos comuns preferem acentuar as diferenças entre as resultantes é real e corresponde senão a uma eliminação pelo
duas técnicas. De facto, se ambas as técnicas consistem em menos a uma real redução da correlação e à máxima indepen-
metodologias de redução do número de variáveis, ACP preo- dência das variáveis.
cupa-se em manter o mais possível da variabilidade dos dados A aplicação desta técnica tem vários pressupostos [5]:
gerando componentes não correlacionados, AFE procura de-
terminar os fatores latentes que estão na génese da correlação  As variáveis devem ter escalas numéricas contínuas ou de
entre os dados não sendo fundamental o resultado desta técnica intervalo. Como muita da informação recolhida em ciên-
na variância total do sistema. cias sociais é categórica foram criados métodos de escalo-
namento que atribuem valores numéricos a cada categoria
Concetualmente a técnica considera que determinado tipo possibilitando o recurso a AFE [4].
de VI são a soma de 2 componentes, o fator específico η, tam-
bém chamado de erro, e o fator partilhado f que normalmente  As amostras devem ser aleatórias. com um 5 a 10 observa-
será um somatório. Se considerarmos 𝑝 variáveis de uma po- ções mínimas por VI e pelo menos 100 observações.
pulação com o vetor de média µ e a matriz de variância-cova-
 As variáveis de interesse devem apresentar distribuição
riância 𝛴, podemos descrever o modelo como (4) ou em nota-
normal multivariada e relação linear entre si. Cada par de
ção matricial como (5); VI deve apresentar distribuição normal bivariada.
x1 − 𝜇1 = 𝜆11 𝑓1 + 𝜆12 𝑓2 + ⋯ + 𝜆1𝑚 𝑓𝑚 + 𝜂1  ACP assume a inexistência de valores anómalos.
x2 − 𝜇2 = 𝜆21 𝑓1 + 𝜆22 𝑓2 + ⋯ + 𝜆2𝑚 𝑓𝑚 + 𝜂2
(4)  AFE assume e requer uma distribuição normal multivari-

x𝑝 − 𝜇𝑝 = 𝜆𝑝1 𝑓1 + 𝜆𝑝2 𝑓2 + ⋯ + 𝜆𝑝𝑚 𝑓𝑚 + 𝜂𝑝 ada quando utiliza o método de extração da Máxima Vero-
𝒙 − 𝝁 = 𝜦𝑭 + 𝜼 (5) similhança.
A extração de fatores procura encontrar os 𝑚 fatores 𝜆𝑓
O coeficiente 𝜆𝑝𝑚 representa o peso da variável p no fator comuns e os 𝑝 fatores 𝜂 específicos com os quais (5) repre-
m, designando-se a matriz Λ como matriz dos pesos dos fato- sente adequadamente os dados (estandardizados). A forma
res. teórica de atingir este objetivo é calculando os Λ e Ψ com os
Os 𝑝 desvios 𝑥𝑖 − 𝜇𝑖 que podemos notar como 𝑧𝑖 , são ex- quais 𝑅 = ΛΛ′ + η (R é o estimador de ∏).
pressos em função de 𝑝 + 𝑚 variáveis aleatórias 𝑓𝑚 e 𝜀𝑝 que As técnicas concretas são várias, salientando-se quatro;
são variáveis latentes, não observáveis o que diferencia o mo-
delo fatorial do modelo de regressão multivariada em que as  Máxima verosimilhança, em que é necessário pré-definir o
variáveis na posição de 𝑓𝑚 são observáveis. Neste modelo é número de fatores, é obrigatória a normalidade multivari-
preciso assumir segundo Johnson [1, p. 482] que: ada, mas é possível realizar testes χ2.

 Os fatores comuns 𝑓𝑚 são ortogonais, igualmente distribu-  Componentes principais, em que os fatores emergem dos
ídos com µ = 0 e σ2 = 1. dados devido a um critério (autovalores, scree plot).

 Os fatores específicos 𝜂𝑝 são independentes e igualmente  Factoração de eixo principal, que pode utilizar ambos os
sistemas.
distribuídos com µ = 0 e σ2 = Ψ.
 Mínimos quadrados (ponderados e não ponderados), faz a
Se além disso 𝑓𝑚 e 𝜂𝑝 forem independentes o modelo diz-
análise de autovalores em conjunto com procedimentos de
se ortogonal. Newton-Raphson. Minimiza os resíduos.
Tal como 𝑧𝑖 é expresso por uma composição de uma parte C. Método Utilizado
comum e outra específica, o mesmo se passa com 𝜎𝑖𝑖 que pode
ser expressa como (6) em que ℎ𝑖2 é dado por (7) e corresponde No caso em estudo não temos qualquer pré conceção sobre
à parte da variância resultante dos m fatores e designa-se por as motivações das preferências dos leitores pelo que não existe
comunalidade e ψ a variância específica. a possibilidade de pré-definir o número de fatores. O método
da máxima verosimilhança está, portanto automaticamente ex-
𝜎𝑖𝑖 = ℎ𝑖2 + 𝜓𝑖 (6) cluído.
ℎ𝑖2 = 𝜆2𝑖1 + 𝜆2𝑖2 + ⋯ + 𝜆2𝑖𝑚 (7)
Também não temos qualquer pré opinião sobre a variância
A matriz dos pesos Λ e consequentemente a matriz dos fatores dos dados que nos permita estimar se esta se deve ou não divi-
F, podem sofrer uma transformação linear, uma rotação que as dir entre comunalidade e variância específica.
transforme em estruturas simplificadas [2, p. 274]. Isso é feito Assim para a apreciação do caso em estudo optou-se pela
através de uma multiplicação por uma matriz quadrada T tal extração pelo método ACP que parece adequado à situação e
que TT’=I. Assim teremos; suscetível de produzir informação adequada à análise.

𝒙 − 𝝁 = 𝜦𝑭 + 𝜼 = 𝜦𝑻𝑻′ 𝑭 + 𝜼 = 𝜦∗ 𝑭∗ + 𝜼 (8)
onde 𝜦∗ = 𝜦𝑻 e 𝑭∗ = 𝑻′ 𝑭
III. CASO EM ESTUDO A “Tab. 1” apresenta a média amostral e o desvio padrão
para as respostas à pergunta 3.7 do inquérito que consiste em
O caso em estudo é constituído pelos resultados de um in- 12 escolhas que refletem as opiniões dos inquiridos sobre as-
quérito por questionário realizado para identificar hábitos de petos relevantes (para o inquérito) na formação da preferência.
leitura jornalística e eventualmente caracterizar padrões rele- As respostas são dadas numa escala de Liekert em que cada
vantes na escolha. item tem 5 classes, com mínimo em “Discordo totalmente” e
O questionário que suporta o presente estudo é composto máximo em “Concordo totalmente”. As classes são codifica-
por 43 perguntas e estruturado em três grupos de questões. O das com valores de 1 a 5 e é sobre esses valores que são calcu-
primeiro grupo faz a caracterização económico-sócio-demo- ladas as estatísticas descritivas. A coluna N indica o número
gráfica do entrevistado. O segundo grupo caracteriza os hábi- de casos (respostas) válidos em cada escolha que confirma a
tos de leitura de publicações periódicas. O terceiro grupo ca- inexistência de omissões.
racteriza as preferências específicas quanto a publicações na Para jornais e revistas temáticos da área economia e negó-
área da economia. cios os inquiridos aplicam em média 103 minutos por semana,
Foram recolhidas 100 respostas ao questionário, sendo 68 47% lê apenas algumas secções e 39% lê todo o conteúdo e os
completas. Em 12 respostas foi omitida informação etária (per- títulos preferidos são em ordem decrescente, Jornal de negó-
gunta 1.2), em 2 respostas foi omitida informação relativa ao cios (47%), Revista Exame (46%), Suplemento Economia de
tipo de jornal lido (3.2) e em 3 respostas foi omitida informa- um semanário (40%), Revista Prémio (38%), Diário Econó-
ção quanto ao “tipo” de leitura (3.6). mico (28%) e Semanário Económico (2%).
A. Estatísticas demográficas e económicas IV. DESENVOLVIMENTO DO ESTUDO
Os respondentes, são adultos entre os 20 e os 50 anos de A. Objetivo
idade, 1/3 dos quais entre os 20 e os 29 anos de idade, 1/3 entre O objetivo primário do estudo é averiguar a existência de
os 30 e os 35 anos de idade e 1/3 entre os 36 e os 50 anos de fatores latentes que estejam na origem da preferência por uma
idade. 62% são do sexo masculino. 59% reside em áreas urba- publicação periódica em relação às outras. Para este objetivo a
nas, 23% em áreas suburbanas e os restantes em espaço rural.
variável de saída é representada pelas respostas à pergunta 3.6
O nível de instrução académica é de Nível 4 ou inferior (Dos jornais diários generalistas que lê qual é aquele que glo-
para 32% dos inquiridos, Nível 6 para 49 % e Níveis 7 e 8 para balmente prefere) e as variáveis de entrada são as 12 alíneas
os remanescentes 19% dos respondentes. da pergunta 3.7 referenciada acima e na ‘Tab. 1’. O método
utilizado é AFE com extração por CP, utilizando o software
Os rendimentos familiares mensais líquidos dos respon- IBM® SPSS® Statistics version 22.
dentes variam dos 500.00€ aos 2,490.00€ com 51% dos agre-
gados familiares dos respondentes no intervalo entre os B. Desenvolvimento
1,500.00€ e os 2,750.00€ mensais. 1) Verificação dos pressupostos de CP
B. Hábitos de leitura O primeiro pressuposto a verificar é a dimensão da amos-
tra. Esta consiste em 100 participantes e 12 VI, o que corres-
Nas respostas ao inquérito, 85% dos inquiridos afirmou ser ponde a 8,3 participantes por VI. É adequado a uma AFE com
leitor frequente de periódicos generalistas. Destes, 44 só leem extração por CP, embora não ótimo.
diários, 17 só leem semanários e os restantes leem diários e
semanários. Semanalmente os inquiridos leem, em média, 1,6 As VI sobre as quais o estudo vai incidir são uma escala de
jornais diários e ocupam nessa atividade, em média, 2 horas. Likert codificada com valores de 1 a 5. Uma escala de Likert
Essa leitura é, para 50%, apenas de algumas secções enquanto é composta por variáveis qualitativas nominais e a esse título
42% lê atentamente todo o conteúdo. não adequadas à análise pretendida. A codificação em valores
numéricos é um método frequentemente utilizado para ultra-
Dos inquiridos, 42% prefere o “Diário de Notícias e as ra- passar esta insuficiência. Considera-se que os intervalos entre
zões da preferência indicadas estão caraterizadas na Tabela 1. posições são de idêntica dimensão e que a escala pode ser con-
Tabela 1- Estatísticas descritivas, pergunta 3.7 siderada como numérica intervalar. Muitos autores recomen-
Média Desvio Padrão N
dam que o questionário evidencie essa condição, nomeada-
mente incluindo um elemento gráfico que ostensivamente ilus-
Facilidade na leitura e identificação
3,42 1,046 100 tre a equidistância entre valores, o que no caso presente não
das notícias
Leitura agradável 3,65 ,968 100 acontece. Como a base de dados vem codificada aceita-se a
Boa distribuição e organização dos
4,13 ,800 100
utilização salvaguardando a possibilidade de viés.
temas
Boa ilustração (figuras, gráficos, etc) 4,38 ,801 100 É um pressuposto a inexistência de valores anómalos, esse
Primeira página é apelativa 3,85 ,989 100 pressuposto é validado. Um potencial valor anómalo é aquele
Formato Adequado 4,09 ,911 100 que é superior ou inferior a 1,5 vezes a distância interquartil
Dimensão adequada (número de pá-
4,04 ,852 100 (DIQ). Ora dada a amplitude total de 5 quando a média é su-
ginas) perior a 3,5 e DIQ é 1 existem valores calculados como anó-
Periodicidade da publicação é ade-
quada
4,35 ,783 100 malos. O SPSS aponta esses valores nos gráficos boxplot. No
Papel de boa qualidade 4,41 ,986 100 entanto esses valores são aceitáveis face à escala e não se
Informação atualizada 4,16 ,838 100
Temas interessantes 3,92 1,032 100
Boa relação qualidade/preço 3,32 1,127 100
Tabela 2 - Teste de KMO e Bartlett
Medida Kaiser-Meyer-Olkin de adequação de amostragem. ,627
Teste de esfericidade de Bartlett Aprox. χ2 399,490
df 66
Sig. ,000

O teste de Bartlett em ‘Tab. 2’ testa a hipótese nula de a


matriz de correlações ser uma matriz identidade. O teste é
significativo, 0,00 < 0,05, o que demonstra que a matriz de
correlação não é uma matriz de identidade e, portanto, existem
correlações entre as variáveis.
A realização de análise fatorial é adequada.
3) Extração de Fatores e rotação
A extração de fatores é realizada em SPSS pelo método
ACP.
O critério utilizado para definir o número de fatores foi o
critério de Kaiser, isto é, componentes com autovalor superior
Figura 2 - Boxplot de SPSS evidenciando valores anómalos a 1, resultando na extração de 3 fatores. Um segundo critério
comum é o de manter os fatores à esquerda do ponto de infle-
considera que resultem de erros na recolha de dados. Não são, xão do Screeplot, resultando também em 3 fatores. Um ter-
portanto, valores anómalos. No entanto a cauda longa de uma ceiro critério comum é o de manter os fatores que explicam
distribuição fortemente assimétrica, como são as da escala 80% da variância [6, p. 436], o que corresponderia, neste caso,
Likert em análise, pode influenciar o cálculo de correlações e
covariâncias e refletir-se nos resultados.
A normalidade multivariada não pode ser testada em SPSS
pelo que se admite.
Assim sendo os dados são considerados adequados à aná-
lise.
2) Analise das correlações entre variáveis
A matriz de correlações ‘Tab 3’, revela a existência de cor-
relações entre o conjunto das 12 variáveis de interesse, as cé-
lulas assinaladas evidenciam uma correlação elevada entre as
variáveis que pode indiciar uma componente. Também, o de-
terminante calculado pelo SPSS é 0,014 o que indica a inexis-
tência de multi co linearidade [6, p. 445].
A matriz de correlação anti imagem, tem a diagonal com
valores acima de 0,5 o que confirma a adequação do tamanho
da amostra. O mesmo é confirmado pelo valor do teste Kaiser- Figura 3 – Scree plot de SPSS evidenciando o ponto de inflexão principal e
Meyer-Olkin de adequação de amostragem cujo valor situado secundário. À esquerda do primeiro há 3 fatores.
entre 0,5 e 0,7 tem uma qualificação de medíocre.

Tabela 3 - Matriz de correlações


Primeira página é apela-
Boa distribuição e orga-

Boa ilustração (figuras,

Periodicidade da publi-

Papel de boa qualidade

Informação atualizada
identificação das notí-
Facilidade na leitura e

(número de páginas)
Dimensão adequada

Temas interessantes
Formato Adequado

Boa relação quali-


nização dos temas
Leitura agradável

cação é adequada
gráficos, etc)

dade/preço
cias

tiva

Facilidade na leitura e identificação das notícias 1,000 ,635 ,007 ,157 ,071 ,182 ,083 ,041 ,253 ,119 ,144 ,699
Leitura agradável ,635 1,000 ,046 ,251 ,071 ,162 ,189 ,083 ,194 ,057 ,083 ,437
Boa distribuição e organização dos temas ,007 ,046 1,000 ,474 ,421 ,261 ,244 ,330 ,162 ,165 ,123 -,024
Boa ilustração (figuras, gráficos, etc) ,157 ,251 ,474 1,000 ,379 ,395 ,392 ,237 ,389 ,179 ,208 ,200
Primeira página é apelativa ,071 ,071 ,421 ,379 1,000 ,464 ,307 ,147 ,323 ,249 ,137 ,143
Formato Adequado ,182 ,162 ,261 ,395 ,464 1,000 ,568 ,040 ,251 ,140 ,126 ,109
Dimensão adequada (número de páginas) ,083 ,189 ,244 ,392 ,307 ,568 1,000 ,176 ,401 ,302 ,119 ,039
Periodicidade da publicação é adequada ,041 ,083 ,330 ,237 ,147 ,040 ,176 1,000 ,205 ,437 ,522 ,112
Papel de boa qualidade ,253 ,194 ,162 ,389 ,323 ,251 ,401 ,205 1,000 ,250 ,052 ,144
Informação atualizada ,119 ,057 ,165 ,179 ,249 ,140 ,302 ,437 ,250 1,000 ,588 ,159
Temas interessantes ,144 ,083 ,123 ,208 ,137 ,126 ,119 ,522 ,052 ,588 1,000 ,100
Boa relação qualidade/preço ,699 ,437 -,024 ,200 ,143 ,109 ,039 ,112 ,144 ,159 ,100 1,000
Tabela 4 - Comunalidades Tabela 6 - Matriz de componentes rodada a
Inicial Extração Componente
Facilidade na leitura e identificação das notí- 1 2 3
1,000 ,845 Facilidade na leitura e identificação das notícias ,073 ,915 ,052
cias
Leitura agradável 1,000 ,633 Leitura agradável ,159 ,779 ,001
Boa distribuição e organização dos temas 1,000 ,430 Boa distribuição e organização dos temas ,601 -,140 ,223
Boa ilustração (figuras, gráficos, etc) 1,000 ,543 Boa ilustração (figuras, gráficos, etc) ,699 ,167 ,161
Primeira página é apelativa 1,000 ,503 Primeira página é apelativa ,700 ,010 ,111
Formato Adequado 1,000 ,579 Formato Adequado ,750 ,115 -,057
Dimensão adequada (número de páginas) 1,000 ,531 Dimensão adequada (número de páginas) ,721 ,055 ,093
Periodicidade da publicação é adequada 1,000 ,643 Periodicidade da publicação é adequada ,157 ,009 ,786
Papel de boa qualidade 1,000 ,372 Papel de boa qualidade ,553 ,235 ,105
Informação atualizada 1,000 ,653 Informação atualizada ,200 ,079 ,779
Temas interessantes 1,000 ,733 Temas interessantes ,045 ,083 ,851
Boa relação qualidade/preço 1,000 ,693 Boa relação qualidade/preço ,036 ,825 ,109
Método de Extração: Análise de Componente Principal Método de Extração: Análise de Componente Principal.
. Método de Rotação: Varimax com Normalização de Kaiser.
a Rotação convergiu em 5 iterações.

a seis fatores, e também a pontos à esquerda do ponto de infle-


xão secundário do Screeplot e a componentes com autovalores contém as comunalidades (na diagonal) e a correlação entre
acima de 0,7. Também poderíamos fixar arbitrariamente o nú- cada idem em relação ao modelo da extração.
mero de fatores.
Se o modelo da extração apresentasse uma correspondên-
O SPSS produz a tabela de comunalidades ‘Tab 4’.Como cia total com o modelo dos dados a matriz seria idêntica à ma-
indicado anteriormente, em análise fatorial, as comunalidades triz de correlações. A diferença entre os coeficientes de corre-
correspondem à parte da variância comum presente numa va- lação observados e os do modelo são os resíduos. Resíduos
riável. Na ACP utiliza-se a variância total e assume-se que a acima de 0,05 são indesejáveis e uma percentagem superior a
comunalidade inicial de cada variável é 1. Quando os fatores 50% é causa de preocupação quanto à viabilidade do modelo.
são extraídos, novas comunalidade são calculadas represen- Neste caso o SPSS anuncia uma percentagem de 50% o que
tando a correlação entre cada variável e os fatores extraídos. valida o modelo.
Na ‘Tab 4’ são indicadas as comunalidades calculadas pelo
SPSS após a extração. A tabela indica-nos que a variância es- V. RESULTADOS
pecífica 𝜂𝑖 existe em todas as VI, nalguns casos é superior a
Dado o critério de extração adotado (autovalor superior a
0,5 e na grande maioria superior a 0,3.
1) e a análise do scree plot ‘Fig 3’, a estrutura relacional en-
Consequentemente, a parte da variância explicada pelos fa- contrada, para explicar a preferência por um diário com base
tores extraídos não é muito elevada, a ‘Tab 5’ indica que a ex- nos 12 itens estudados, é constituída por três variáveis latentes.
tração explica 60% da variância total do sistema. A rotação Os pesos fatoriais de cada item em cada um dos três fatores
“Varimax” efetuada otimiza a estrutura fatorial dos fatores ex- estão representados na ‘Tab 6’, a comunalidade de cada item
traídos. Segundo [1, p. 507] o critério para a rotação Varimax está indicada na ‘Tab 4’, e a % da variância explicada por cada
com normalização de Kaiser define 𝜆̃∗𝑖𝑗 = 𝜆̂∗𝑖𝑗 ⁄ℎ̂𝑖 como sendo fator está indicada na ‘Tab 5’.
o coeficiente de rotação escalado pela raiz quadrada da comu- O primeiro fator apresenta pesos fatoriais elevados em 6
nalidade. Assim, o procedimento Varimax seleciona a trans- itens evidenciados na 2ª coluna da ‘Tab 6’ e explica 23,6% da
formação ortogonal que maximiza, variância total. O segundo fator apresenta pesos fatoriais ele-
𝑚 𝑝 𝑝 2 vados em 3 itens evidenciados na 3ª coluna da ‘Tab 6’ e ex-
1 𝜆∗4
𝑖𝑗 𝜆∗2
𝑖𝑗 plica 18,8% da variância total. O terceiro fator apresenta pesos
𝑉 = ∑ [𝑝 ∑ ∗4 − (∑ ∗2 ) ] (9)
𝑝 ℎ𝑖 ℎ𝑖 fatoriais elevados em 3 itens evidenciados na 4ª coluna da ‘Tab
𝑗=1 𝑖= 𝑖=1
6’ e explica 17,3% da variância total. No conjunto os três fa-
tores explicam 59,7% da variância total.
Após a rotação o SPSS calcula a matriz de correlações re-
produzidas (não incluída neste artigo devido à dimensão) que
Tabela 5 - Variância total explicada
Valores próprios iniciais Somas de extração de pesos ao quadrado Somas rodadas de pesos ao quadrado
Componente
Total % de variância % cumulativa Total % de variância % cumulativa Total % de variância % cumulativa
1 3,562 29,687 29,687 3,562 29,687 29,687 2,826 23,551 23,551
2 1,970 16,415 46,102 1,970 16,415 46,102 2,257 18,806 42,357
3 1,626 13,546 59,648 1,626 13,546 59,648 2,075 17,291 59,648
4 ,969 8,072 67,720
5 ,815 6,789 74,509
6 ,737 6,138 80,648
7 ,530 4,414 85,061
8 ,498 4,147 89,208
9 ,467 3,893 93,101
10 ,393 3,276 96,377
11 ,267 2,225 98,602
12 ,168 1,398 100,000
Método de Extração: Análise de Componente Principal.
A análise efetuada comprovou que a amostra era adequada
à finalidade pretendida pelo que o trabalho podia prosseguir.
No decorrer da análise foram detetadas três variáveis laten-
tes que explicam 60% da variação dos dados analisados.
Verificou-se que as variáveis encontradas podem ser des-
critas como aspetos independentes da formação das decisões
analisadas e podem, portanto, servir de instrumento para a
compreensão do processo de escolha.
Foram atribuídas designações genéricas a estas variáveis.
Constatou-se que a parte não explicada da variância é ainda
elevada, o que indica que as variáveis estudadas não modelam
com perfeição o processo estudado.
Considera-se que o questionário utilizado pode ter insufici-
ências e deverá, oportunamente, ser complementado com
Figura 4 – Gráfico tridimensional dos componentes extraídos itens adicionais tendo como base os fatores agora identifica-
dos.
O primeiro fator é designado por “Estética Visual”, o se- Considera-se que o estudo efetuado atingiu os objetivos
gundo por “Simplicidade e Economia” e o terceiro por “Atua- propostos.
lidade Informativa.
Os resultados da análise foram calculados em SPSS que os REFERÊNCIAS
apresenta em forma de matriz. A matriz de componentes, a
matriz ortogonal utilizada na rotação dos fatores e a matriz de [1] R. A. Johnson e D. W. Wichern, Applied Multivariate Statistical
componentes rodada, ‘Tab 6’. Essa informação é complemen- Analysis, Harlow: Pearson, 2014.
tada pelo gráfico de componentes no espaço rodado ‘Fig 4’ [2] E. Reis, Estatística Multivariada Aplicada, Lisboa: Edições Sílabo,
onde o agrupamento de variáveis resultante da extração e rota- lda., 2001.
ção é evidente. [3] N. A. Campbell e W. R. Atchley, “The Geometry of Canonical Variate
Analysis,” Systematic Zoology, vol. Vol. 30, 1881.
[4] J. Marôco, Análise Estatística com o SPSS Statistics, Pêro Pinheiro:
VI. CONCLUSÕES
ReportNumber, 2014.
As considerações e conclusões tidas como pertinentes fo- [5] D. D. Suhr, “Principal Component Analysis vs. Exploratory Factor
ram na sua maioria já enunciadas ao longo do trabalho. Assim Analysis,” em SUGI 30 Proceedings, Philadelphia, 2005.
ir-se-á neste capítulo efetuar a sua síntese, sumariar os aspetos [6] A. P. Field, Discovering Statistics Using SPSS for Windows:
essenciais e sugerir eventuais desenvolvimentos futuros. Advanced Techniques for Beginners, Thousand Oaks: Sage
Publications, Inc., 2000.
Neste trabalho foi efetuada uma Análise Fatorial Explora-
tória a uma amostra de um inquérito de opinião. Esta análise
foi executada utilizando “IBM® SPSS® Statistics version 22”.

You might also like