You are on page 1of 26

ESTADSTICA DESCRIPTIVA CON SPSS

(2602) Estadstica Econmica


Joaqun Alegre y Magdalena Cladera

SPSS es una aplicacin para el anlisis estadstico. En este material se


presentan los procedimientos bsicos de este programa para la gestin y el
anlisis descriptivo de datos. Concretamente, los contenidos son los siguientes:

1. Entorno de trabajo .........................................................................1


2. Etiquetado de las variables y los valores .......................................4
3. Seleccin de casos ........................................................................7
4. Transformacin de las variables ....................................................9
5. Anlisis descriptivo de variables cualitativas................................12
6. Anlisis descriptivo de variables cuantitativas .............................15
6.1. Distribucin de frecuencias e histograma .............................15
6.2. Estadsticos descriptivos ......................................................15
7. Asociacin de variables cualitativas.............................................21
8. Correlacin...................................................................................24

1. ENTORNO DE TRABAJO
Tipos de archivos
- Archivos de datos. Extensin .sav.
- Resultados: Extensin .spo.
- Sintaxis: Extensin .sps.
Importacin de datos desde Excel
Es suficiente con abrir el archivo desde SPSS. Si el archivo tiene varias hojas
debe indicarse cual es la que quiere utilizarse, as como el rango de celdas en
el que se encuentran los datos que desean importarse, si ste es distinto al que
aparece por defecto. Una vez abierto, se guarda con extensin .sav.
Ejemplo 1. En la Figura 1, Figura 2 y Figura 3 se presentan los pasos a seguir
para abrir el archivo EDT02.xls desde SPSS.

1
Figura 1

Figura 2

2
Figura 3

Exportacin de datos a Excel


Es suficiente con, desde SPSS, guardar el archivo que se desea exportar con
extensin *.xls.
Ejemplo 2. En la Figura 4 y la Figura 5 se presentan los pasos a seguir para
guardar el archivo EDT02.sav como archivo de Excel.

Figura 4

3
Figura 5

2. ETIQUETADO DE LAS VARIABLES Y LOS VALORES


Cada una de las variables de una base de datos de SPSS tiene un nombre que
puede tener hasta ocho caracteres. Un nombre tan corto puede ser poco
informativo, de manera que resulta conveniente especificar, adems, una
etiqueta para la variable, es decir, una definicin que permita identificar
fcilmente su contenido.
Por otra parte, tambin es de gran utilidad a la hora de interpretar los
resultados de los anlisis estadsticos, tener etiquetados los valores de las
variables cualitativas, es decir, asociar a cada uno de los valores una definicin
que exprese su significado.
Vista de datos y Vista de variables
En un archivo de datos de SPSS hay dos pestaas:
- Vista de datos (Figura 6), en la que se tienen los valores de las variables
para cada observacin.
- Vista de variables (Figura 7), en la que se presenta la informacin sobre
diversas caractersticas de las variables (nombre, tipo, anchura,
decimales, etiqueta, valores perdidos, columnas, alineacin, medida).

4
Figura 6

Figura 7

El etiquetado de las variables y los valores se lleva a cabo desde la pestaa


Vista de variables, tal y como se explicar a continuacin.

5
Etiquetado de las variables
El etiquetado de una variable consiste en especificar una definicin, lo ms
breve y clara posible, que permita identificar con claridad el significado de dicha
variable.
Ejemplo 3. En la Figura 8 se muestra como la variable das se ha etiquetado
con la expresin Das de estancia en las Islas.

Figura 8

Haciendo clic se puede


modificar el nombre de
la variable Haciendo clic se puede
escribir la etiqueta de la
variable

Etiquetado de los valores


Las categoras de una variable cualitativa suelen representarse por valores
numricos. El etiquetado de los valores consiste en especificar para cada uno
de ellos una breve definicin que permita identificar cual es la categora de la
variable que representan.
Ejemplo 4. En la Figura 9 se muestra el procedimiento de etiquetado de los
valores de la variable edad, para indicar que el valor 1 se corresponde con
Menores de 30 aos, el valor 2 con Entre 30 y 45 aos, etc.

6
Figura 9

3. SELECCIN DE CASOS
En ocasiones interesa trabajar slo con una parte de los datos, con aquellos
que cumplen determinadas caractersticas, para lo que es til la opcin
Seleccionar casos del men Datos.
Ejemplo 5. De la Figura 10 a la Figura 12 se muestra como se seccionaran las
observaciones correspondientes a los turistas menores de 30 aos.

Figura 10

7
Figura 11

En este cuadro se
escribe la condicin
que deben cumplir
los datos que se
van a seleccionar

Figura 12

!!!
Si se activa esta opcin
se perdern de forma
irrecuperable todas las
observaciones que no se
seleccionen

Para volver a trabajar con todas las observaciones se activa la opcin Todos
los casos en el cuadro de dilogo de la Figura 13.

8
Figura 13

4. TRANSFORMACIN DE LAS VARIABLES


Las opciones Calcular y Recodificar del men Transformar permiten realizar
transformaciones en las variables o crear nuevas variables a partir de las ya
existentes en la base de datos.
Ejemplo 6. En la Figura 14 se ilustra como utilizar la opcin Calcular para
obtener una variable que contenga el gasto en euros (geuros) a partir de la
variable de gasto en pesetas (gtotal).

9
Figura 14

Expresin utilizada
para el clculo de
la nueva variable

Nombre de la
nueva variable

La opcin Recodificar permite, por ejemplo, agrupar un conjunto de valores de


una variable categrica, agrupar en intervalos una variable cuantitativa,
cambiar la codificacin de los valores, etc.
Existen dos opciones:
- Recodificar en la misma variable. Se substituye la variable original por
la/s variable/s recodificada/s.
- Recodificar en distintas variables. Se mantiene la variable original y se
aade/n la/s variable/s con la nueva codificacin.
Ejemplo 7. De la Figura 15 a la Figura 17 se muestra el procedimiento a seguir
para recodificar la variable nacionalidad, de manera que los valores superiores
a 4 queden recogidos en una nica categora representada por el valor 5. En
primer lugar se selecciona Recodificar En distintas variables del men
Transformar.

10
Figura 15

2
1

Nombre y
etiqueta de la
nueva variable

Figura 16

Tomarn valor 5
en la variable
recodificada

Los valores 1
superiores a 4 en
la variable original

2
Figura 17

Se quedan igual
en la variable
recodificada

El resto de valores
(1 a 4) de la
variable original

11
Si en algn momento se quiere un resumen de las variables contenidas en una
base de datos de SPSS, sus caractersticas y su etiquetado, se puede obtener
seleccionando la opcin Mostrar informacin de datos del men Archivo, o bien
seleccionando la opcin Informacin del archivo del men Utilidades.
Por otra parte, para ver en la base de datos las etiquetas de los valores, se
tiene que seleccionar la opcin Etiquetas de valor en el men Ver.

5. ANLISIS DESCRIPTIVO DE VARIABLES CUALITATIVAS


La opcin Frecuencias del men Analizar Estadsticos Descriptivos permite
obtener distribuciones de frecuencias, representaciones grficas de dichas
distribuciones, y los estadsticos descriptivos ms utilizados.
Ejemplo 8. De la Figura 18 a la Figura 22 se expone el procedimiento a seguir
para realizar un anlisis descriptivo bsico de la variable edad. Los resultados
que se obtienen son los de la Figura 23.

Figura 18

12
Figura 19

Figura 20

Figura 21

13
Figura 22

Figura 23

Estadsticos

EDAD
N Vlidos 575
Perdidos 3
Mediana 2,00
Moda 1

EDAD

Porcentaje Porcentaje
Frecuencia Porcentaje vlido acumulado
Vlidos MENOS DE 30 AOS 263 45,5 45,7 45,7
ENTRE 30 Y 45 204 35,3 35,5 81,2
ENTRE 45 y 60 87 15,1 15,1 96,3
MS DE 60 AOS 21 3,6 3,7 100,0
Total 575 99,5 100,0
Perdidos Sistema 3 ,5
Total 578 100,0

EDAD

Perdido
MS DE 60 AOS

ENTRE 45 y 60

MENOS DE 30 AOS

ENTRE 30 Y 45

14
6. ANLISIS DESCRIPTIVO DE VARIABLES CUANTITATIVAS

6.1. Distribucin de frecuencias e histograma


Para obtener la distribucin de frecuencias de una variable cuantitativa es
conveniente agrupar los valores en intervalos. Posteriormente puede obtenerse
la distribucin de frecuencias y su representacin grfica de la forma descrita
en el epgrafe anterior.
Otra forma de representar grficamente la distribucin de frecuencias de una
variable cuantitativa es mediante un histograma. Para obtenerlo puede
utilizarse una de estas dos alternativas:
- Se sigue el procedimiento descrito en el epgrafe 5, y en el cuadro de
dilogo de la Figura 21 se activa la opcin Histogramas.
- Se selecciona la opcin Histograma del men Grficos.
En ambos casos se obtiene el mismo resultado.
Ejemplo 9. En la Figura 24 se tiene el histograma del gasto total.

Figura 24

GASTO TOTAL PC Y DIA


60

50

40

30

20
Frecuencia

10 Desv. tp. = 4720,52


Media = 10353,9
0 N = 535,00
10
30 0,0
50 0,0
70 0,0
90 0,0
11 0,0
13 00
15 00
17 00
19 00
21 00
23 0
25 00
0
0
0
0
0
0
0 ,0
0 ,0
0 ,0
0 ,0
00 , 0
0 ,0
00 , 0
0,
0

GASTO TOTAL PC Y DIA

6.2. Estadsticos descriptivos


El procedimiento expuesto en el epgrafe 5 tambin permite obtener los
principales estadsticos descriptivos de una variable cuantitativa. Los
estadsticos que interese obtener se seleccionan en el cuadro de dilogo de la
Figura 19.
Alternativamente, se puede utilizar la opcin Estadsticos descriptivos
Descriptivos del men Analizar.

15
Ejemplo 10. Para obtener un resumen de los principales estadsticos
descriptivos de la variable das puede procederse de la forma que se muestra
en la Figura 25 y la Figura 26. Los resultados que se obtienen son los de la
Figura 27.

Figura 25

Figura 26

16
Figura 27

Estadsticos descriptivos

Estadstico Error tpico


DAS DE ESTANCIA N 578
Rango 28
Mnimo 2
Mximo 30
Media 10,19 ,17
Desv. tp. 3,983
Varianza 15,862
Asimetra ,882 ,102
Curtosis 1,892 ,203
N vlido (segn lista) N 578

Otra alternativa, algo ms completa que las anteriores, consiste en seleccionar


la opcin Estadsticos descriptivos Explorar del men Analizar. Esta opcin
permite obtener un resumen de los principales estadsticos descriptivos de
posicin central y de dispersin, percentiles, valores extremos, y
representaciones grficas como el histograma o el diagrama de caja.
Ejemplo 11. De la Figura 28 a la Figura 31 se muestra la utilizacin de la
opcin Explorar para obtener los principales instrumentos que permiten realizar
un anlisis descriptivo de la variable das. Los resultados que se obtienen son
los de la Figura 32.

Figura 28

17
Figura 29

Figura 30

Figura 31

18
Figura 32

Explorar
Resumen del procesamiento de los casos

Casos
Vlidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
DAS DE ESTANCIA 578 100,0% 0 ,0% 578 100,0%

Descriptivos

Estadstico Error tp.


DAS DE ESTANCIA Media 10,19 ,166
Intervalo de confianza Lmite inferior 9,86
para la media al 95% Lmite superior
10,51

Media recortada al 5% 10,07


Mediana 8,00
Varianza 15,862
Desv. tp. 3,983
Mnimo 2
Mximo 30
Rango 28
Amplitud intercuartil 7,00
Asimetra ,882 ,102
Curtosis 1,892 ,203

Percentiles
Promedio DAS DE ESTANCIA 5 6,00
ponderado(definicin 1) 10 7,00
25 7,00
50 8,00
75 14,00
90 14,00
95 14,00
Bisagras de Tukey DAS DE ESTANCIA 25 7,00
50 8,00
75 14,00

19
Valores extremos

Nmero
del caso Valor
DAS DE ESTANCIA Mayores 1 307 30
2 331 30
3 340 30
4 43 21
5 102 21a
Menores 1 360 2
2 111 2
3 110 2
4 550 3
5 540 3b
a. En la tabla de valores extremos mayores slo se muestra
una lista parcial de los casos con el valor 21.
b. En la tabla de valores extremos menores slo se muestra
una lista parcial de los casos con el valor 3.

DAS DE ESTANCIA
Histograma
300

200

100
Frecuencia

Desv. tp. = 3,98


Media = 10,2
0 N = 578,00
2,5 7,5 12,5 17,5 22,5 27,5
5,0 10,0 15,0 20,0 25,0 30,0

DAS DE ESTANCIA

40

30 307
331
340

20

10

-10
N= 578

DAS DE ESTANCIA

20
7. ASOCIACIN DE VARIABLES CUALITATIVAS
La distribucin de frecuencias conjunta de dos variables cualitativas, as como
las medidas estadsticas que permiten analizar su asociacin, tanto si se trata
de variables nominales como de variables ordinales, se pueden obtener
mediante la opcin Descriptivos Tablas de contingencia del men Analizar.
Ejemplo 12. El procedimiento a seguir para el anlisis de la asociacin entre la
edad y la intencin de retorno se muestra en la Figura 33 a la Figura 36. Los
resultados que se obtendran son los presentados en la Figura 37.

Figura 33

21
Figura 34

Figura 35

22
Figura 36

Figura 37

Resumen del procesamiento de los casos

Casos
Vlidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
PIENSA VOLVER A
PASAR LAS
543 93,9% 35 6,1% 578 100,0%
VACACIONES EN
NUESTRA ISLA * EDAD

Tabla de contingencia PIENSA VOLVER A PASAR LAS VACACIONES EN NUESTRA ISLA * EDAD

EDAD
MENOS DE ENTRE ENTRE MS DE
30 AOS 30 Y 45 45 y 60 60 AOS Total
PIENSA VOLVER A SI Recuento 205 158 73 17 453
PASAR LAS Frecuencia esperada 208,6 156,8 70,9 16,7 453,0
VACACIONES EN % de PIENSA
NUESTRA ISLA VOLVER A PASAR
45,3% 34,9% 16,1% 3,8% 100,0%
LAS VACACIONES
EN NUESTRA ISLA
% de EDAD 82,0% 84,0% 85,9% 85,0% 83,4%
% del total 37,8% 29,1% 13,4% 3,1% 83,4%
NO Recuento 45 30 12 3 90
Frecuencia esperada 41,4 31,2 14,1 3,3 90,0
% de PIENSA
VOLVER A PASAR
50,0% 33,3% 13,3% 3,3% 100,0%
LAS VACACIONES
EN NUESTRA ISLA
% de EDAD 18,0% 16,0% 14,1% 15,0% 16,6%
% del total 8,3% 5,5% 2,2% ,6% 16,6%
Total Recuento 250 188 85 20 543
Frecuencia esperada 250,0 188,0 85,0 20,0 543,0
% de PIENSA
VOLVER A PASAR
46,0% 34,6% 15,7% 3,7% 100,0%
LAS VACACIONES
EN NUESTRA ISLA
% de EDAD 100,0% 100,0% 100,0% 100,0% 100,0%
% del total 46,0% 34,6% 15,7% 3,7% 100,0%

23
Pruebas de chi-cuadrado

Sig. asinttica
Valor gl (bilateral)
Chi-cuadrado de Pearson ,826a 3 ,843
Razn de verosimilitud ,835 3 ,841
Asociacin lineal por
,738 1 ,390
lineal
N de casos vlidos 543
a. 1 casillas (12,5%) tienen una frecuencia esperada inferior a 5.
La frecuencia mnima esperada es 3,31.

Medidas direccionales

Error tp. Sig.


a
Valor asint. T aproximada aproximada
Nominal Lambda Simtrica ,000 ,000 .b .b
por nominal PIENSA VOLVER A
PASAR LAS b b
VACACIONES EN ,000 ,000 . .
NUESTRA ISLA
dependiente
EDAD dependiente ,000 ,000 .b .b
Tau de Goodman PIENSA VOLVER A
y Kruskal PASAR LAS c
VACACIONES EN ,002 ,003 ,844
NUESTRA ISLA
dependiente
EDAD dependiente ,001 ,002 ,765c
a. Asumiendo la hiptesis alternativa.
b. No se puede efectuar el clculo porque el error tpico asinttico es igual a cero.
c. Basado en la aproximacin chi-cuadrado.

Medidas simtricas

Sig.
Valor aproximada
Nominal por Coeficiente de
,039 ,843
nominal contingencia
N de casos vlidos 543
a. Asumiendo la hiptesis alternativa.
b. Empleando el error tpico asinttico basado en la hiptesis
nula.

8. CORRELACIN
Para obtener una matriz de correlaciones entre dos o ms variables se dispone
de la opcin Correlaciones Bivariadas del men Analizar.
Ejemplo 13. En la Figura 38 se tiene el cuadro de dilogo utilizado para
solicitar la matriz de correlaciones de las variables de satisfaccin, y en la
Figura 39 se tienen los resultados obtenidos.

24
Figura 38

25
Figura 39

Correlaciones

NIVEL DE NIVEL DE
SATISFACCI SATISFACCI NIVEL DE NIVEL DE
NIVEL DE NIVEL DE N CALIDAD N CALIDAD SATISFACCI SATISFACCI
SATISFACCI SATISFACCI ALOJAMIENT MEDIOAMBIE N PRECIO N PRECIO
N GLOBAL N PLAYAS O NTE COMIDAS OCIO
NIVEL DE SATISFACCIN Correlacin de Pearson 1 ,417** ,481** ,472** ,314** ,342**
GLOBAL Sig. (bilateral) . ,000 ,000 ,000 ,000 ,000
N 531 509 491 491 498 458
NIVEL DE SATISFACCIN Correlacin de Pearson ,417** 1 ,273** ,390** ,199** ,207**
PLAYAS Sig. (bilateral) ,000 . ,000 ,000 ,000 ,000
N 509 533 504 506 513 476
NIVEL DE SATISFACCIN Correlacin de Pearson ,481** ,273** 1 ,520** ,223** ,214**
CALIDAD ALOJAMIENTO Sig. (bilateral) ,000 ,000 . ,000 ,000 ,000
N
491 504 514 500 498 464

NIVEL DE SATISFACCIN Correlacin de Pearson ,472** ,390** ,520** 1 ,280** ,297**


CALIDAD Sig. (bilateral) ,000 ,000 ,000 . ,000 ,000
MEDIOAMBIENTE N 491 506 500 514 499 467
NIVEL DE SATISFACCIN Correlacin de Pearson ,314** ,199** ,223** ,280** 1 ,761**
PRECIO COMIDAS Sig. (bilateral) ,000 ,000 ,000 ,000 . ,000
N 498 513 498 499 522 474
NIVEL DE SATISFACCIN Correlacin de Pearson ,342** ,207** ,214** ,297** ,761** 1
PRECIO OCIO Sig. (bilateral) ,000 ,000 ,000 ,000 ,000 .
N 458 476 464 467 474 481
**. La correlacin es significativa al nivel 0,01 (bilateral).

26

You might also like