You are on page 1of 33

Anlise Exploratria

de Dados no SPSS
Grcos e Esta-s.cas Descri.vas
Flvia F. Feitosa
BH1350 Mtodos e Tcnicas de Anlise da Informao para o Planejamento
Junho de 2015

Leitura de Referncia
Captulo 1 p. 47-59

Captulo 3
Explorando Dados
(p. 85 124)

Inferncia Esta2s3ca

Mtodo cientco para tirar concluses sobre os
parmetros da populao a partir da coleta,
tratamento e anlise dos dados de uma amostra
recolhida dessa populao.

Inferncia Esta2s3ca
PARAMTRICA: Admite que a distribuio da
populao tem uma forma matemtica
conhecida, embora contendo um ou mais
parmetros desconhecidos.

NO-PARAMTRICA: Pretende-se conhecer a
forma da distribuio

Inferncia Esta2s3ca
PARAMTRICA: Admite que a distribuio da
populao tem uma forma matemtica
conhecida, embora contendo um ou mais
parmetros desconhecidos.


Em muitos casos, uma distribuio normal.

Normalidade dos Dados


Assume-se que os dados foram obtidos de uma ou
mais populaes normais.

Pesquisadores vericam suas amostras
(histograma e outros testes) e se a amostra
assemelha-se a uma normal, assume-se que a
populao tambm o .

Explorando Dados no SPSS


1. Distribuio dos Escores e Valores Atpicos
(vericao da normalidade dos dados)
2. Corrigindo problemas nos dados
3. Transformando dados

Explorando Dados
Abra o arquivo Agua2010_SNIS.sav
Analyze > Descriptive > Explore >
Statistics > Plots

Explorando Dados
A Distribuio Normal?
Positivamente assimtrica
Leptocrtica

Uma distribuio normal dever ter


assimetria e curtose nulas. Ser possvel que a distribuio
da populao assemelhe-se a uma normal?
Converter assimetria e curtose em
escores-z

Explorando Dados
A Distribuio Normal?
Positivamente assimtrica
Leptocrtica
Curtose e
Assimetria
Signicativa

zs=(1.532-0)/.037=41.4
zk=(7.097-0)/.074=95.9

Uma distribuio normal dever ter


assimetria e curtose nulas. Ser possvel que a distribuio
da populao assemelhe-se a uma normal?
Converter assimetria e curtose em
escores-z

Histograma - Outliers
Importante para a deteco
de erros, valores atpicos e
observao da forma da
distribuio dos dados

Valores atpicos (outliers)


Distorcem a mdia e
inacionam o desvio padro

Explorando Dados Box Plot

Boxplot

Explorando Dados Box Plot

Boxplot

Explorando Dados Q-Q Plot


(quan3l-quan3l plot)

Valores esperados
caso a varivel
tenha uma
distribuio
normal

Valores Observados na Amostra

Explorando Dados por Regies


Graphs > Histogram

Histograma por Regies

Esta2s3cas por Regies


Analyze > Descriptive > Explore

!!!
z=.294/.168= 1.75
z=-.077/.334= 0.23

Z=1.339/.063=21.25
z=-5.378/.127=42.35

Z=1.225/.067=18.3
z=-6.499/.135=48.1

z=2.671/.076=35.1
z=18.517/.153= 121

z=2.315/.126=18.4
z=14.757/.252= 58.6

No histograma parece simtrica, mas


nas estatsticas no. Pq?

Boxplot (Caixa e Bigodes)

OUTLIERS !!!

Poucos
outliers

Q-Q Plots

CORRIGINDO PROBLEMAS NOS


DADOS

Observou algum erro de digitao


que gostaria de corrigir?
V para o editor de dados, em go to case

Edite o valor desejado

Reduzindo o Impacto de Outliers


1. Remover o caso
S deve ser feito se tiver uma boa razo para acreditar que esse valor no
representante da populao.

2. Transformar os dados
Dever ser feito no caso de termos uma distribuio no normal. Costumam
reduzir o impacto de outliers.

3. Substituir o valor
O prximo escore mais alto adicionado de 1
Inverter o valor do escore-z (adicionar o triplo do desvio padro mdia e
substituir o valor atpico por esse)
A mdia mais dois desvios padro (variao do mtodo acima)

Transformao dos Dados


Para corrigir problemas relacionados no-normalidade da
distribuio ou valores atpicos (outliers)

a. Transformao logaritmica (log(Xi))


Tomar o logaritmo de um conjunto de nmeros esmaga a cauda direita da
distribuio. uma boa maneira de reduzir uma assimetria positivo.
Ateno: No podemos obter logaritmo de zero ou valores negativos. Se tiver
zero nos dados, faa log(Xi+1)

Transformao dos Dados


Para corrigir problemas relacionados no-normalidade da
distribuio ou valores atpicos (outliers)

b. Transformao por radiciao (sqr(Xi))


Tomar a raiz quadrada de valores grandes tem efeito maior do que extrair a
raiz de efeitos pequenos. til para dados com assimetria positiva.
Problemas com nmeros negativos.

c. Transformao recproca (1/Xi)


Dividir 1 por cada escore reduz o impacto dos grandes valores. A varivel
transformada ter um limite inferior de zero (grandes valores caro prximos
de zero.
Ateno: Este tipo de transformao reverte os escores (valores grandes se
tornaro pequenos e vice-versa)

Transformando Dados no SPSS


Transform > Compute

Transformando Dados no SPSS


CONSUMO

LOG(CONSUMO + 1)

Transformando Dados no SPSS


Transform > Compute

Transformando Dados no SPSS


CONSUMO

SQR(CONSUMO)

Transformando Dados no SPSS


Vocs podem usar o comando Transform > Compute para
realizar as mais diversas transformaes nos dados!

Por exemplo: Normalizar os dados, calcular taxas e
propores, etc.

PARTE II

Realizar anlises exploratrias sobre


os dados do trabalho do curso!!!
Para importar um arquivo .csv ou .dbf para o SPSS, v em:
File > Read Text Data

DICA: Vocs podem importar o arquivo .dbf que compe o
arquivo vetorial (shapele)

A3vidade
A ser entregue no dia 30/06 (Pode ser realizado em grupo)
Utilizando os dados que pretende usar no trabalho nal da disciplina:
a. Calcule as estatsticas descritivas de uma varivel de sua
escolha. Explique cada uma delas.
b. Apresente o histograma, box-plot e Q-Q Plot. Explique.
c. Realize alguma(s) transformao(es) em uma ou mais
variveis selecionadas (ex: log, raiz quadrada). Explique.
d. Se houver grupos distintos (bairros, distritos), repita os itens
(a) e (b) para cada grupo. Compare intervalos de conana
da mdia de uma varivel de interesse. H sobreposies? O
que isso signica? Interprete!
CAPRICHE NAS ANLISES!!!
J estamos elaborando o trabalho nal da disciplina!!!

You might also like