You are on page 1of 160

SAS Enterprise Guide

Co p y ri g h t © S A S In st i t u t e In c . A l l ri g h t s re se rve d .
2
Agenda

• Conhecendo o SAS Enterprise Guide


• Data Set SAS
• Bibliotecas
• Importação de dados
• Análise Descritiva
• Gráficos
- Gráfico de barras
- Gráfico de setores
- Box-plot
• Outliers

Co p y ri g h t © S A S In st i t u t e In c . A l l ri g h t s re se rve d .
O QUE FAZ O SAS ENTERPRISE GUIDE?

Geração de Relatórios Publicação das


Acesso a Dados Manipulação de Dados
e Análises Infomações

Access
HTML

Excel

PDF
SAS
SPSS

Email
Oracle

Canal de
SQL Server Publicação
Geração de Relatórios Publicação das
Acesso a Dados Manipulação de Dados
e Análises Infomações

11
nbmnmbvmbvm
INICIALIZANDO A FERRAMENTA
INICIALIZANDO A FERRAMENTA
CONHECENDO A FERRAMENTA
CONHECENDO A FERRAMENTA

Árvore do Projeto
CONHECENDO A FERRAMENTA

CONHECENDO A FERRAMENTA

Árvore do Projeto
CONHECENDO A FERRAMENTA

CONHECENDO A FERRAMENTA

Bibliotecas
CONHECENDO A FERRAMENTA

Lista de
Tarefas
CONHECENDO A FERRAMENTA

Status das tarefas


CONHECENDO A FERRAMENTA

CONHECENDO A FERRAMENTA

Status das tarefas

Profa. Adriana Silva - adrianamms@usp.br 26


CONHECENDO A FERRAMENTA

CONHECENDO A FERRAMENTA

Barra de
tarefas
CONHECENDO A FERRAMENTA

Process Flow
CONHECENDO A FERRAMENTA
DATA SET SAS
DATA SET SAS

Um data set SAS é uma tabela retangular


contendo linhas e colunas.

Linhas
(observações)

Colunas(variáveis)
DATA SET SAS

Todas as colunas devem ter um nome, um tipo e


um tamanho.

Os nomes
das
variáveis
podem ter
de 1 à 32
posições.
DATA SET SAS

O tipo da coluna poderá ser caracter (string) ou


numérico. Dependendo do tipo, o tamanho da
variável será impactado de forma diferenciada.

Numéricos – valores tem 8 bytes:


Caracter valores vão Numérico
de 1 à 32767 Monetário
caracteres
(bytes).
Data
Hora
FORMATOS
VALORES MISSING

Se os dados não estão presentes para uma coluna em


uma particular linha, este valor é considerado missing.
 Um valor caracter missing é exibido como um espaço em
branco.
 Um valor numérico missing é exibido como um ponto.
BIBLIOTECA SAS

Arquivos

Bibliotecas
BIBLIOTECA SAS

 A biblioteca de dados SAS é uma coleção de um ou


mais arquivos SAS que podem ser referenciados e
armazenados em uma unidade física. Cada arquivo é
um membro da biblioteca.
 Bibliotecas SAS ajudam na organização de seu
trabalho. Por exemplo, se um programa SAS usa mais
de um arquivo SAS, então você pode manter todos os
arquivos na mesma biblioteca.
 Organização de arquivos em bibliotecas facilitam na
localização de arquivos e facilitam na referenciação
em outro programa.
BIBLIOTECA SAS

 Bibliotecas Default

 Permanentes
 SASHELP
 SASUSER

 MAPS

 Temporária
 Work
BIBLIOTECA SAS

Criação de uma biblioteca via point-and-click:

 Tools
 Assign Project Library...
BIBLIOTECA SAS

 Criação de uma biblioteca via point-and-click – Guide


BIBLIOTECA SAS

 Digita-se o nome da biblioteca - Next


(Só pode começar com letra ou underscore e tamanho máximo é de 8
caracteres)
BIBLIOTECA SAS

 Seleciona-se o local de leitura e armazenamento


dos arquivos SAS - Next
BIBLIOTECA SAS
BIBLIOTECA SAS

 Next
BIBLIOTECA SAS

 Testa-se a criação da biblioteca - Finish


BIBLIOTECA SAS
BIBLIOTECA SAS

Criação de uma biblioteca via código:


 File
 New...
 Program....
BIBLIOTECA SAS
BIBLIOTECA SAS
BIBLIOTECA SAS
BIBLIOTECA SAS
IMPORTAÇÃO DE DADOS

FORMATOS DE ARQUIVO PARA IMPORTAÇÃO:

 Excel – quantidade_vendida.xlxs
 Atividade: transformar em Data Set SAS, salvar na biblioteca TRI.
 Txt – total_dinheiro_vendido.txt
 Atividade: transformar em Data Set SAS, salvar na biblioteca TRI.
 SAS – custo_produto.sas7bdat
 Atividade: transformar em Data Set SAS, salvar na biblioteca TRI.
IMPORTAÇÃO ARQUIVO EM EXCEL

 File
 Import Data
IMPORTAÇÃO ARQUIVO EM EXCEL
IMPORTAÇÃO ARQUIVO EM EXCEL

 Localiza-se o arquivo quantidade_vendida na pasta - Open


IMPORTAÇÃO ARQUIVO EM EXCEL

 Salva-se o novo Data Set SAS na biblioteca TRI


criada anteriormente – Browse...
IMPORTAÇÃO ARQUIVO EM EXCEL

 Seleciona-sea planilha de interesse (no caso, Sheet1) e marca-se


a opção de que a primeira linha é o nome da variável – Next>
IMPORTAÇÃO ARQUIVO EM EXCEL

 Nostep 3 verificamos se os tipos das variáveis estão de


acordo com os dados – Next>
IMPORTAÇÃO ARQUIVO EM EXCEL

 Finish
IMPORTAÇÃO ARQUIVO EM EXCEL

 Data Set SAS criado


IMPORTAÇÃO ARQUIVO EM TXT

 File
 Import Data
IMPORTAÇÃO ARQUIVO EM TXT
IMPORTAÇÃO ARQUIVO EM TXT
 Localiza-se o arquivo total_dinheiro_vendido na pasta -
Open

Profa. Adriana Silva - adrianamms@usp.br


IMPORTAÇÃO ARQUIVO EM TXT
 Salva-se o novo Data Set SAS na biblioteca
TRI criada anteriormente – Browse...
IMPORTAÇÃO ARQUIVO EM TXT
 Automaticamente o software já seleciona o delimitador usado e
reconhe que a primeira linha refere-se ao nome da variável –
Next>
IMPORTAÇÃO ARQUIVO EM TXT
 Nostep 3 verificamos se os tipos das variáveis estão de
acordo com os dados – Next>
IMPORTAÇÃO ARQUIVO EM TXT

 Finish
IMPORTAÇÃO ARQUIVO EM TXT
 Data Set SAS criado
ABERTURA DE ARQUIVO EM FORMATO SAS

 Cria-se uma biblioteca com leitura direto onde os dados


estão salvos.
 Basta abrir a biblioteca e clicar duas vezes no arquivo.
ABERTURA DE ARQUIVO EM FORMATO SAS
ENTENDIMENTO DOS DADOS

 quantidade_vendida.sas7bdat

 Variáveis:
 AnoQuarter: Ano e Quarter em que o produto foi vendido;
 Linha_produto: Linha a que o produto pertence;
 Quantidade_vendida: Número de produtos vendidos, por
linha, ano e quarter.
ENTENDIMENTO DOS DADOS

 Total_dinheiro_vendido.sas7bdat

 Variáveis:
 AnoQuarter: Ano e Quarter em que o produto foi vendido;
 Linha_produto: Linha a que o produto pertence;
 Categoria_produto: Categoria do Produto (nível logo
abaixo da Linha do produto);
 Total_dinheiro_vendido: Total de dinheiro recebido com a
vendas dos produtos, por categoria, linha, ano e quarter.
ENTENDIMENTO DOS DADOS

 Custo_produto.sas7bdat

 Variáveis:
 AnoQuarter: Ano e Quarter em que o produto foi vendido;
 Linha_produto: Linha a que o produto pertence;
 Categoria_produto: Categoria do Produto (nível logo abaixo
da Linha do produto);
 Custo_dinheiro: Custo total em dinheiro do produto,
por categoria, linha, ano e quarter.
OBJETIVO DE NEGÓCIO

 A empresa fornecedora da informação está querendo


sanar algumas dúvidas sobre o comportamento dos
dados.
 Toda a análise será feita em nível de Linha do
produto, ou seja, existe a necessidade de agrupamento
das informações (ao nível de Linha) para 2 tabelas
fornecidas.
 As dúvidas serão feitas após o trabalho da criação de
uma tabela única para análise, fazendo os
agrupamentos necessários.
MANIPULAÇÃO DOS
DADOS

 Imposição da análise: resultados devem ser expostos


para cada LINHA de produto.

 As tabelas total_dinheiro_vendido e custo_produto estão


em nível de categoria.
 Sugestão da empresa: Fazer a soma das variáveis
Total_dinheiro_vendido e Custo_dinheiro por Linha, Ano e
Quarter.
MANIPULAÇÃO DOS
DADOS

 Primeiro Passo:
 Sumarização das tabelas ao nível de Linha

 Criação de um novo Process Flow, chamado:


 “Manipulação dos Dados”
 File...

 New

 Process Flow
• “F2” para renomear o Process Flow.

 Arrastar a tabela total_dinheiro_vendido para o novo


Process Flow.
MANIPULAÇÃO DOS
DADOS
MANIPULAÇÃO DOS DADOS
 Clicando com o botão direito em cima da tabela:
 Query Builder...
MANIPULAÇÃO DOS
DADOS
MANIPULAÇÃO DOS
DADOS

 Query name:
 “Nível de Linha”

 Output Name:
 Clica-se em Change...
 Muda-se o nome do arquivo para:

 Total_dinheiro_vendido_linha
 Biblioteca a ser selecionada:
 Work
MANIPULAÇÃO DOS
DADOS
MANIPULAÇÃO DOS

D ADOS as variáveis listadas para a aba Select Data:
Arrasta-se
 AnoQuarter
 Linha_produto
 Total_dinheiro_vendido
MANIPULAÇÃO DOS

D ADOS
Seleciona-se a opção SUM dentro da coluna Summary
na variável numérica - Run
MANIPULAÇÃO DOS
Vizualizando o resultado

D ADOS

TRI.total_dinheiro_vendido

WORK.total_dinheiro_vendido_linha
MANIPULAÇÃO DOS DADOS

 O mesmo procedimento será realizado para a tabela


custo_produto.
 Arrastar a tabela custo_produtoo para o novo Process Flow.
MANIPULAÇÃO DOS
 D ADOS com o botão direito em cima da
Clicando tabela:
 Query Builder...
MANIPULAÇÃO DOS
DADOS
MANIPULAÇÃO DOS
DADOS

 Query name:
 “Nível de Linha”

 Output Name:
 Clica-se em Change...
 Muda-se o nome do arquivo para:

 Custo_produto_linha
 Biblioteca a ser selecionada:
 Work
MANIPULAÇÃO DOS
DADOS
MANIPULAÇÃO DOS DADOS
 Arrasta-se as variáveis listadas para a aba Select Data:
 AnoQuarter
 Linha_produto
 Custo_dinheiro
MANIPULAÇÃO DOS DADOS
 Seleciona-se
a opção SUM dentro da coluna Summary na
variável numérica - Run
MANIPULAÇÃO DOS
DADOS
 Vizualizando o resultado

WORK.custo_produto

WORK.custo_produto_linha
MANIPULAÇÃO DOS
DADOS

 Como as 3 tabelas já estão no mesmo formato (nível de


linha), o segundo passo será:

 Juntar as 3 tabelas em uma única tabela que deverá


estar salva na biblioteca TRI com o nome:
 empresaXPTO

 Arrasta-se a tabela quantidade_vendida (biblioteca TRI)


para o Process Flow “Manipulação dos dados”
MANIPULAÇÃO DOS DADOS
 Clicando com o botão direito na tabela
total_dinheiro_vendido_total e Query Builder...
MANIPULAÇÃO DOS
DADOS
MANIPULAÇÃO DOS
DADOS

 Query name:
 “Tabela única”

 Output Name:
 Clica-se em Change...
 Muda-se o nome do arquivo para:

 empresaxpto
 Biblioteca a ser selecionada:
 TRI
MANIPULAÇÃO DOS
DADOS
MANIPULAÇÃO DOS
DADOS
 Clica-se em Add Tables e iremos adicionar as tabelas:
 WORK.custo_produto_linha
 TRI.quantidade_vendida

Profa. Adriana Silva - adrianamms@usp.br


MANIPULAÇÃO DOS
DADOS
MANIPULAÇÃO DOS
DADOS
 Clica-se em Join Table para definir as chaves (variáveis)
que ligam as tabelas:
 AnoQuarter
 Linha_produto

Profa. Adriana Silva - adrianamms@usp.br


MANIPULAÇÃO DOS DADOS
 Por default o SAS linka a primeira variável como mesmo nome que encontra em cada
tabela.
 Para inserirmos uma nova chave, basta clicar com botão direito na variável
Linha_produto, Join, t2, Linha_produto. E assim com todas as tabelas.

Profa. Adriana Silva - adrianamms@usp.br


MANIPULAÇÃO DOS
DADOS
 Close
MANIPULAÇÃO DOS
DADOS
 Arrasta-se as variáveis listadas para a aba Select Data:
 AnoQuarter
 Linha_produto
 SUM_of_Total_dinheiro_vendido
 Quantidade_vendida
 SUM_of_Custo_dinheiro
MANIPULAÇÃO DOS
DADOS
 Run
MANIPULAÇÃO DOS
DADOS
 Vizualizando o resultado
MANIPULAÇÃO DOS
DADOS
Vizualizando o resultado

WORK.custo_dinheiro_linha

WORK.total_dinheiro_vendido_linha

TRI.quantidade_produto

TRI.empresaxpto
OBJETIVO DE NEGÓCIO

1) Qual é a linha mais importante com relação ao número


de produtos vendidos?

Sugestão: Gráfico de setores


OBJETIVO DE NEGÓCIO

 Após a criação de um novo Process Flow chamado:


“Estatísticas Descritivas”
 Arrasta-se a tabela empresaxpto para o fluxo.

 Seleciona-se a tabela e

 Tasks
 Graph
 Pie Chart Wizard
OBJETIVO DE NEGÓCIO
OBJETIVO DE NEGÓCIO

 Next>
OBJETIVO DE NEGÓCIO

 Slice: Linha_produto
 Slice size: Quantidade_vendida
 Next>
OBJETIVO DE NEGÓCIO

 Next>
OBJETIVO DE NEGÓCIO

 Finish
OBJETIVO DE NEGÓCIO

1) Qual é a linha mais importante com relação ao número


de produtos vendidos?
OBJETIVO DE NEGÓCIO

2) Qual é a linha mais importante com relação ao valor do


Lucro?

Sugestão: Gráfico de barras


OBJETIVO DE NEGÓCIO

 Calcula-se uma nova variável, Lucro:


 Lucro = SUM_of_Total_dinheiro_vendido -
SUM_of_Custo_dinheiro
 Clicando com o botão direito na tabela empresaxpto e
Query Builder...
 Query name:
 “Criando Lucro”
 Output Name:
 Clica-se em Change...
 Muda-se o nome do arquivo para:

 Empresaxpto_lucro
 Biblioteca a ser selecionada:
 WORK

 Arrasta-se todas as variáveis para a aba Select Data


OBJETIVO DE NEGÓCIO
OBJETIVO DE NEGÓCIO

 Clica-se em “Computed Columns”


OBJETIVO DE NEGÓCIO

 New...
OBJETIVO DE NEGÓCIO

 Advanced expression – Next>


OBJETIVO DE NEGÓCIO

 Digita-se a expressão – Next>


OBJETIVO DE NEGÓCIO

 Identifier: Lucro
 Column Name: Lucro
 Finish
OBJETIVO DE NEGÓCIO

 Close
OBJETIVO DE NEGÓCIO

 Run
OBJETIVO DE NEGÓCIO
OBJETIVO DE NEGÓCIO
 Seleciona-se a tabela empresaxpto_lucro e:
 Tasks
 Graph
 Bar Chart Wizard
OBJETIVO DE NEGÓCIO

 Next>
OBJETIVO DE NEGÓCIO

 Next>
OBJETIVO DE NEGÓCIO

 Next>
OBJETIVO DE NEGÓCIO

 Finish
OBJETIVO DE NEGÓCIO

2) Qual é a linha mais importante com relação ao valor do


Lucro?
OBJETIVO DE NEGÓCIO

3) Qual o AnoQuarter em que o número de unidades


vendidas foi mais baixo, para a linha Children?

Sugestão: Gráfico de linha


OBJETIVO DE NEGÓCIO
 Seleciona-se a tabela empresaxpto_lucro:
 Tasks
» Graph
» Line Plot Wizard
OBJETIVO DE NEGÓCIO

 Edit...
OBJETIVO DE NEGÓCIO

 Task filter:
OBJETIVO DE NEGÓCIO

 Next>
OBJETIVO DE NEGÓCIO

 Next>
OBJETIVO DE NEGÓCIO

 Next>
OBJETIVO DE NEGÓCIO

 Next>
OBJETIVO DE NEGÓCIO

 Finish
OBJETIVO DE NEGÓCIO

3) Qual o AnoQuarter em que o número de unidades


vendidas foi mais baixo, para a linha Children?
OBJETIVO DE NEGÓCIO

4) Qual a média de preço de cada linha?

Sugestão: Summary Statistics...


OBJETIVO DE NEGÓCIO

 Calcula-se uma nova variável, Preço:


 Preco = SUM_of_Total_dinheiro_vendido /
Quantidade_vendida
 Clicando com o botão direito na tabela empresaxpto_lucro
e Query Builder...
 Query name:
 “Criando Preço”
 Output Name:
 Clica-se em Change...
 Muda-se o nome do arquivo para:

 Empresaxpto_lucro_preco
 Biblioteca a ser selecionada:
 TRI

 Arrasta-se todas as variáveis para a aba Select Data


OBJETIVO DE NEGÓCIO

 Clica-se no atalho para criação de uma nova variável


OBJETIVO DE NEGÓCIO

 Advanced expression - Next


OBJETIVO DE NEGÓCIO

 Digita-se a expressão - Next


OBJETIVO DE NEGÓCIO

 Finish
OBJETIVO DE NEGÓCIO

 Run
OBJETIVO DE NEGÓCIO
 Seleciona-se a tabela empresaxpto_lucro_preco:
 Tasks
» Describe
» Summary Statistics Wizard...
OBJETIVO DE NEGÓCIO

 Next>
OBJETIVO DE NEGÓCIO
 Summary statistics: Preco
 For each value of: Linha_produto
 Next>
OBJETIVO DE NEGÓCIO

 Next>
OBJETIVO DE NEGÓCIO

 Finish
OBJETIVO DE NEGÓCIO

4) Qual a média de preço de cada linha?

Sugestão: Summary Statistics...


OBJETIVO DE NEGÓCIO

5) A categoria Sports é sensível a preço? Ou seja, quando


aumenta o preço a quantidade vendida cai?

Sugestão: Scatter Plot


OBJETIVO DE NEGÓCIO
 Seleciona-se a tabela empresaxpto_lucro_preco:
 Tasks
» Graph
» Scatter Plot...
OBJETIVO DE NEGÓCIO
 Seleciona-se “2D Scatter Plot”
OBJETIVO DE NEGÓCIO
 Na opção Data:
 Horizontal: Quantidade_vendida
 Vertical: Preco
 Group chart by: Linha_produto - Run
OBJETIVO DE NEGÓCIO
5) A categoria Sports é sensível a preço? Ou seja, quando
aumenta o preço a quantidade vendida cai?
OBJETIVO DE NEGÓCIO

6) Qual a linha que teve maior variação de preço durante os


meses estudados?

Sugestão: Box Plot


BOX-PLOT

outliers > 1.5 IQR


limite maior <= 1.5 IQR
1.5 IQR.

Percentil 75

Percentil (mediana) 50
Percentil 25
1.5 IQR.

limite menor <= 1.5 IQR

A média é exibida por um ◊.


OUTLIER

 As observações que apresentam um grande


afastamento das restantes ou são incosistentes com
elas são chamadas de outliers.

 Também são conhecidas como observações “anormais”,


contaminantes, estranhas, extremas ou aberrantes.
OUTLIER – CAUSAS DE SEU APARECIMENTO

 Possíveis explicações para a ocorrência de outiler:

 Erros humanos ao medir ou digitar os dados


 Corrigir ou, eventualmente, eliminar os outliers do estudo

 Natureza do fenômeno em estudo


 Alguns autores não consideram como outliers
OBJETIVO DE NEGÓCIO

6) Qual a linha que teve maior variação de preço durante os


meses estudados?

Sugestão: Box Plot


OBJETIVO DE NEGÓCIO
 Seleciona-se a tabela empresaxpto_lucro_preco:
 Tasks
» Graph
» Box Plot...
OBJETIVO DE NEGÓCIO
 Seleciona-se “Box Plot”
OBJETIVO DE NEGÓCIO
 Na opção Data:
 Horizontal: Linha_produto
 Vertical: Preco - Run
OBJETIVO DE NEGÓCIO

5) Qual a linha que teve maior variação de preço durante os


meses estudados?
EXERCÍCIO PARA TREINAR DEPOIS

 Crie um novo Process Flow chamado “Exercício para


entregar”
 Abra os dados TRI.complemento_ano_quarter

 Abra os dados TRI.empresaxpto_lucro_preco

 Junte as duas tabelas em uma única chamada


(TRI.empresaxpto_2005)
 Dica: Tasks / Data / Apend Table...
 Repare que as tabelas tem os mesmos nomes nas variáveis

 Após criado a tabela única, responda as perguntas:


EXERCÍCIO PARA TREINAR DEPOIS

1. A Linha Sports continua sendo a linha mais


importante para empresa XPTO com relação ao
número de produtos vendidos?
Sugestão: Gráfico de Setores
2. Qual o valor do terceiro quartil para a Linha “Outdoor”
com relação a variável Lucro? Qual é a interpretação
desse valor?
Sugestão: Summary Statistics...

3. Faça o box-plot para a variável quantidade_vendida e


interprete-o. Existe alguma anomalia? Em qual Linha
de produto?
Sugestão: Box-Plot

4. Qual o Ano/Quarter em que a quantidade vendida, na


Linha Sports, foi mais alta?Qual a quantidade vendida?
Sugestão: Gráfico de Linha
REFERÊNCIA

 Tutorial SAS Enterprise Guide


http://support.sas.com/documentation/onlinedoc/guide/tut43/en/menu.h
tm

 Griffiths, D. Use a cabeça! Estatística. Alta Books, Rio de Janeiro,


2009.

 Moore, D., McCabe, G., Duckworth, W., Sclove, S. A prática


da Estatística Empresarial. LTC, Rio de Janeiro, 2006.

 Anderson, D., Sweeney, D., Williams, T. Estatística Aplicada à


Administração e Economia. Segunda Edição. Cengage Learning.
São Paulo, 2011.

You might also like