You are on page 1of 61

FACULDADE DE BALSAS

CURSO DE SISTEMAS DE INFORMAO

CRIAO DE UM AMBIENTE DE EXPLORAO OLAP


PARA ANALISAR DADOS DAS VENDAS DO GRUPO DE POSTOS
DE COMBUSTVEIS PIONEIRO

CAIRO DA SILVA BORGES

BALSAS (MA)
2010

FACULDADE DE BALSAS
CURSO DE SISTEMAS DE INFORMAO

CRIAO DE UM AMBIENTE DE EXPLORAO OLAP


PARA ANALISAR DADOS DAS VENDAS DO GRUPO DE POSTOS
DE COMBUSTVEIS PIONEIRO

POR:
CAIRO DA SILVA BORGES

Trabalho de Concluso de Curso apresentado


como exigncia parcial para obteno do ttulo de
Bacharel em Sistemas de Informao Faculdade
de Balsas, sob a orientao do Professor Junior
Bandeira.

BALSAS (MA)
2010

FACULDADE DE BALSAS
CURSO DE SISTEMAS DE INFORMAO
A Comisso Examinadora, abaixo assinada, aprova o Trabalho de
Concluso de Curso (TCC).

CRIAO DE UM AMBIENTE DE EXPLORAO OLAP


PARA ANALISAR DADOS DAS VENDAS DO GRUPO DE POSTOS
DE COMBUSTVEIS PIONEIRO

Elaborada por
CAIRO DA SILVA BORGES
como requisito parcial para obteno de Bacharel em Sistemas de Informao

BANCA EXAMINADORA

__________________________________
Prof (a). Junior Bandeira
Prof. Orientador
__________________________________
Prof (a). Jos Sinotti
Membro da Banca Examinadora
__________________________________
Prof (a). Cassiana Fagundes
Membro da Banca Examinadora

DEDICATRIO
Dedico este trabalho de concluso de curso a Deus por me ter oferecido a
oportunidade de viver, evoluir a cada dia, a todos os meus familiares que me
ajudaram a alcanar mais um objetivo na minha vida, aos meus pais em especial
pelo apoio e carinho recebido durante esta etapa, a minha namorada que no mediu
esforos para me ajudar a continuar nesta trajetria.

AGRADECIMENTOS

Ao Prof. Junior Bandeira, meu orientador, pelo apoio, pacincia, credibilidade e


compreenso que me proporcionou.
Ao Prof Gustavo Borges, meu co-orientador, pela ajuda prestada e ateno
dedicada a este trabalho.
Ao Coordenador do curso de Sistemas de Informao, Prof Marlon Possani, pela
amizade e apoio dedicado durante todo o perodo acadmico.
Aos meus companheiros de curso.
A todos que contriburam direta e indiretamente na realizao deste trabalho.

RESUMO
Na busca de um diferencial competitivo as empresas atuam dinamicamente. Nesta
busca, uma das tcnicas transformar dados armazenados com o tempo em
informaes que auxiliem a tomada de deciso com o objetivo de descobrir fatos e
atuar com aes. Este tipo de soluo a Business Intelligence (BI), que utiliza
ferramentas que possibilitam a explorao dos dados, transformando em
informaes visuais e de fcil entendimento para os gestores. No mercado existem
inmeras ferramentas de BI, o presente trabalho utilizou o software livre, PENTAHO
na verso 3.5. Aplicou-se a soluo de BI ao Grupo de Postos de Combustveis
Pioneiro na qual se constitui por empresas localizadas nas cidades de Balsas e
Aailndia no Maranho. A soluo resume-se na construo de um cubo OLAP,
onde o mesmo explora uma grande massa de dados precisos e rpidos, referente s
vendas ocorridas entre os perodos de 2009 e 2010. Construiu-se ainda um Data
Mart de vendas para armazenar e centralizar os dados histricos, alm de um
framework em linguagem de programao PHP que realizou a importao dos
dados dos Data Warehouses para o Data Mart central. Dessa forma a soluo
proveu uma comparao dos dados explorados com os feriados e fatores
socioeconmicos de cada uma das cidades utilizando a tcnica de estatstica Anova,
com objetivo de agregar conhecimento para analisar fatos ocorridos nos perodos,
ou ainda, usando a soluo como vantagem competitiva.

Palavras - chaves: Business Intelligence (BI). Postos Pioneiro. OLAP. Banco de


Dados.

SUMRIO

1. INTRODUO ........................................................................................................ 9
1.1 Delimitao do tema .......................................................................................... 9
1.2 Problemtica ...................................................................................................... 9
1.3 Objetivos ............................................................................................................ 9
1.3.1 Geral ........................................................................................................... 9
1.3.2 Especfico.................................................................................................... 9
1.4 Justificativa ...................................................................................................... 10
1.5 Metodologia ..................................................................................................... 10
2. REFERENCIAL TERICO .................................................................................... 12
2.1 Armazenamento de Banco de Dados .............................................................. 12
2.2 Business Intelligence ....................................................................................... 12
2.2.1 Fontes de dados........................................................................................ 13
2.2.2 ETL (Extraction, Transformation and Loading).......................................... 14
2.2.3 Modelagens ............................................................................................... 14
2.2.4 Data Warehouse e Data Marts .................................................................. 17
2.2.5 Explorao dos dados ............................................................................... 18
2.2.6 Cubos de dados OLAP.............................................................................. 20
2.2.7 Linguagens................................................................................................ 27
2.2.8 Ferramentas OLAP ................................................................................... 28
2.3 PENTAHO uma ferramenta Open Source de BI .............................................. 28
2.3.1 A Plataforma ............................................................................................. 28
2.3.2 Caractersticas .......................................................................................... 30
2.3.3 Ferramentas .............................................................................................. 30
2.4 SPSS (Statistical Package for the Social Sciences) ........................................ 34
2.4.1 Anlise de varincia (Anova) ..................................................................... 35

3. ESTUDO DE CASO .............................................................................................. 37


3.1 A Empresa ....................................................................................................... 37
3.2 As vendas ........................................................................................................ 39
3.3 A soluo ......................................................................................................... 40
3.4 Relaes entre vendas com feriados e fatores socioeconmicos ................... 51
4. CONCLUSO........................................................................................................ 57
5. REFERNCIAS BIBLIOGRFICAS ...................................................................... 58

1. INTRODUO
Neste captulo sero apresentados os objetivos definidos no trabalho,
justificativas e metodologias utilizadas assim como a delimitao do tema proposto.
1.1 Delimitao do tema
O trabalho busca apresentar a criao de um ambiente de explorao dos
dados atravs da tcnica OLAP com a montagem de um cubo para analisar os
dados das vendas nos perodos de 2009 e 2010 do Grupo de Postos de
Combustveis Pioneiro, fazendo uma comparao entre os feriados e fatores
socioeconmicos com as vendas neste perodo e exemplificando como eles podem
ser utilizados na tomada de decises.
1.2 Problemtica
A problemtica do sistema atual est em no proporcionar ao gestor uma
viso completa do andamento das vendas, podendo analisar os dados em apenas
duas dimenses (tempo e vendas), o que dificulta uma tomada de decises mais
rpida e precisa, alm da demora no processamento dos dados pr-existentes.
1.3 Objetivos
1.3.1 Geral
Tornar a gesto do Grupo de Postos de Combustveis Pioneiro mais
dinmica, com base na anlise de relatrios multidimensionais oriundos do Cubo
OLAP.
1.3.2 Especfico

Fazer comparativo de vendas e lucratividade entre perodos semelhantes;

Analisar se existem relaes entre os feriados e fatores socioeconmicos com


as vendas nos perodos de 2009 e 2010;

Criar um Data Mart central para importao dos dados das vendas;

Definir a estrutura do Cubo;

Estudar e implementar a ferramenta PENTAHO;

Proporcionar uma viso completa do andamento das vendas de todos os


produtos;

10

Tornar a tomada de decises mais precisa, tendo como referencial os dados


extrados do Cubo OLAP;

1.4 Justificativa
Atravs de relatos informais fornecidos pelo gestor do Grupo de Postos de
Combustveis Pioneiro, pode-se analisar a dificuldade em realizar comparativos de
vendas com a ferramenta de gesto atual, de acordo com a problemtica
supracitada.
O sistema atual possibilita tambm a realizao de comparaes entre
perodos, porm no oferece o dinamismo que o Cubo OLAP proporciona. A
ferramenta proposta gera relatrios interligados enquanto que o sistema atual gera
relatrios em separado, o que dificulta a visualizao do conjunto de dados.
Com a criao do ambiente de explorao OLAP atravs da montagem do
Cubo, cada face pode ser analisada para posterior agrupamento dos dados das
outras faces. A implantao do Cubo OLAP traz consigo a possibilidade de uma
gesto facilitada, ampliando as potencialidades do empreendimento com os
benefcios agregados pelo mesmo.
1.5 Metodologia
O levantamento dos dados foi realizado atravs das informaes reais de
vendas, repassadas pelo gestor do Grupo de Postos de Combustveis Pioneiro,
como tambm pelos relatos informais do mesmo.
A metodologia utilizada para o desenvolvimento deste trabalho constituda
por quatro fases:
Primeira: anlise quantitativa (juntamente com o gestor da empresa) para extrao
de informaes pertinentes s vendas do grupo;
Segunda: realizao de estudo sobre a tcnica OLAP;
Terceira: Implementao da tcnica do Cubo OLAP com referncia aos dados
extrados na primeira fase, analisando-se especificamente os resultados obtidos
com a ao.

11

Quarta: Utilizao da tcnica de Anova (anlise de varincia) para realizar uma


comparao entre os feriados e fatores socioeconmicos com as vendas nos
perodos de 2009 e 2010.
O trabalho que segue, est dividido da seguinte forma: captulo 2; todo o
referencial terico com as definies das tcnicas utilizadas; no captulo 3 o estudo
de caso, com a definio da necessidade do gestor do Grupo de Postos de
Combustveis Pioneiro alm da contextualizao do ambiente explorado, a definio
do modelo e ferramentas utilizadas bem como os resultados obtidos, finalizando com
a anlise entre as vendas e os feriados e fatores socioeconmicos. Por fim, no
captulo 4 as consideraes finais do trabalho desenvolvido.

12

2. REFERENCIAL TERICO
Neste tpico ser abordado todo o referencial terico utilizado no trabalho,
bem como as definies das tcnicas e ferramentas que foram utilizadas.
2.1 Armazenamento de Banco de Dados
De acordo com o livro escrito por Ferrari (2007) banco de dados pode ser
definido como um local no qual possvel armazenar informaes, para consultas
ou utilizao quando necessrio. J Ramakrishnan (2008) define Sistemas
Gerenciadores de Banco de Dados (SGBD) um software projetado para auxiliar a
manuteno e utilizao de vastos conjuntos de dados.
Com o passar do tempo os dados armazenados se tornaram grandes e
volumosos sendo capaz de gerar uma lentido em consultas e processamento, para
solucionar este problema surgiu ento os Sistemas de Banco de Dados Relacionais
(SGBDR), cuja principal caracterstica gerenciar seus dados usando apenas as
capacidades relacionais.
Segundo Rosa (2004) hoje o grande problema dos SGBDs, tornou-se a
manipulao das informaes, nunca se precisou extrair informaes inteligentes
como agora, o principal motivo disso est em que as empresas crescem
constantemente com dados e informaes.
2.2 Business Intelligence
Nos ltimos tempos, os sistemas empresariais avanaram consideravelmente,
por conseguinte, os dados tambm evoluram, em funo desse crescimento, a
utilizao do processo de Inteligncia de Negcios (BI) em uma organizao cresceu
fortalecendo a obteno de informaes gerenciais de maneira rpida e flexvel de
tal forma que os gestores da empresa possam tomar decises gerenciais.
A implantao do BI em uma empresa deve-se relacionar diretamente com o
gestor da empresa, definindo o objetivo geral, atravs de entrevistas, estabelecer os
objetivos especficos em base com os dados analisados. A partir das informaes
coletadas, pode-se realizar uma anlise das ferramentas necessrias.
Para Felber (2005) BI a utilizao de uma srie de ferramentas para coletar,
analisar e extrair informaes, que sero utilizadas no auxlio ao processo de
tomada de decises.

13

A figura 1 exibe todo o framework de implantao de BI em uma empresa,


dando-se inicio a extrao, carregamento e transformao dos dados contidos no
Data Warehouse que por sua vez pode ser organizado por Data Marts. O Data
Warehouse como o Data Mart serve de fonte de dados para explorao OLAP e
Data Mining, com resultado final exibido em interface intuitiva os dados explorados.

Figura 1: Processo de BI (Business Intelligence)


Fonte: Miranda (2010)

Um dos principais problemas encontrados durante o processo de extrao


dos dados de outras fontes a forma de que estes dados esto modelados,
dificultando todo o processo de BI, para isto o processo de Extraction,
Transformation and Loading (ETL) cuida do tratamento.
2.2.1 Fontes de dados
As fontes de dados so necessariamente os softwares instalados na
empresa, por exemplo: (aplicativos comerciais, sistema de estoque, base de dados,
etc.), dados externos (internet, documentaes), planilhas eletrnicas. Toda a fonte
de dados possui seu repositrio de dados independente com o objetivo de realizar
as atividades e armazenar seus dados.

14

2.2.2 ETL (Extraction, Transformation and Loading)


ETL basicamente, esse processo indica que as informaes devem ser
extradas das bases transacionais, transformadas para se adequar ao modelo
multidimensional definido, e carregadas no Data Warehouse. Existem diversas
ferramentas que visam apoiar a execuo desse processo. Durante o processo a
parte mais difcil se encontra na transformao, pois, indica as regras que devem ser
aplicadas sobre os dados para evitar redundncias e inconsistncias garantindo uma
viso nica e integrada dos dados. O processo de ETL possibilita extrair os dados
de diversas fontes criando uma viso nica e consistente dos dados, a seguir a
figura 2, ilustra o processo de ETL.

Figura 2: Processo de ETL


Fonte: Withee (2010, Pag. 78)

O processo de ETL deve ser realizado de forma dinmica sem deixar de lado
a regra de negcio que a empresa definir, deixando os dados de todo o processo de
forma simples para compreenso.
2.2.3 Modelagens
O SGBD possibilita que os usurios definam os dados que sero
armazenados em forma de modelo de dados, as modelagens podem ser definidas
como:

Modelagem Relacional:
A modelagem relacional foi criada para facilitar os acessos aos dados

possibilitando que os usurios utilizassem uma grande variedade de abordagens no


tratamento das informaes, conforme Rodriguez (2000) este modelo est baseado

15

no modelo matemtico de relacionamento de conjuntos, a estrutura de dados


flexvel tornando a viso dos dados simplificada.
Seu principal conceito a Entidade Relacionamento (ER), que descreve todo
sistema e o relacionamento entre os dados em um modelo grfico.
A modelagem relacional a mais utilizada para modelagem de dados, pela
sua forma estruturada de relacionar os dados.

Modelagem Orientada a Objetos:


Os conceitos de orientao a objetos tambm pode ser representada em

banco de dados assim como na programao, Rodriguez (2000) representa uma


estrutura, onde os dados so tratados como objeto e atravs disso possvel
relacionar com atributos. De acordo com Figueiredo e Soares (2005) em seu artigo
define a comparao entre modelagem relacional e modelagem orientada a objetos,
enquanto a modelagem estruturada relacional baseia-se em conceitos de entidades
e atributos, tais como relacionamentos, normalizao, chaves para evitar a
redundncia e inconsistncia modelagem orientada a objetos se define
basicamente em conceitos, estruturas e modelos baseados no mundo real.

Modelagem Multidimensional:
Apresenta caractersticas de utilizar uma estrutura de dados em dimenses,

atravs de uma tabela centralizadora (tabela fato), e de tabelas que se relacionam


com a mesma, chamada de tabela dimenses, enquanto a tabela fato armazena as
medidas e variveis, as tabelas dimenses caracterizam por apresentar vises sobre
as medies e formas de visualizar os dados.
Atravs de uma estrutura multidimensional se torna mais fcil a anlise dos
dados de forma detalhada sendo mais efetiva para o ambiente empresarial. A
implementao se torna mais complexa necessitando de uma linguagem para o
modelo, como a MDX, sendo muito parecida com o SQL, porm suporta realizar
consultas de n dimenses, enquanto o SQL suporta apenas duas dimenses, das
vendas por tempo como mostra a figura 3.

16

Figura 3: Viso SQL e Multidimensional


Fonte: Autor Prprio (2010)

Surgiu ento o conceito de cubo, pois o mesmo apresenta uma melhor viso
dos dados explorados, a figura 4 mostra um modelo de cubo, o assunto ser mais
detalhado no item 2.2.6.
Segundo Maganha (2006), a modelagem multidimensional permite que o
usurio final observe seu banco de dados em formato de cubo com n dimenses, o
nmero de dimenses definido pelo projetista baseado em aspectos comuns de
negcio da empresa.

Figura 4: Cubo de dados sob viso Multidimensional


Fonte: Oracle (2010)

A modelagem multidimensional a forma mais indicada para realizar a


visualizao de dados estruturados em vrias dimenses realizando uma explorao
mais efetiva dos dados.

17

2.2.4 Data Warehouse e Data Marts


Segundo Ramakrishnan (2008) o Data Warehouse contm dados de
diferentes fontes de dados, cobrindo um longo perodo de tempo. Data Warehouse
quer dizer (armazm de dados), os dados deste ambiente so utilizados de forma
analtica para o processo de tomada de deciso dos negcios.
Para visualizar e realizar as anlises sobre os dados armazenados no Data
Warehouse podem ser utilizadas, basicamente, duas abordagens: ferramentas
OLAP e minerao de dados. Conforme Arajo (2007) a tecnologia OLAP possibilita
s organizaes um mtodo de acesso, visualizao, e anlise de dados
corporativos com alta flexibilidade e desempenho, por meio de relatrios e anlises a
cubos de dados. De acordo com Alves (2009) Data Mart so na verdade um
subconjunto de informaes existentes no Data Warehouse, cujo desenho
elaborado de tal forma a atender a um segmento ou unidade de uma organizao.
Como mostra na figura 5, a melhor estrutura de uma Data Warehouse
quando ele composto por Data Marts, se no houver esta organizao a
complexidade de explorao e organizaes dos dados sero imensas, alm de
gerar uma manuteno mais rdua e complexa. Data Mart um subconjunto de uma
Data Warehouse, cujo objetivo facilitar a explorao de dados por reas.

Figura 5: Viso Data Warehouse e Data Marts


Fonte: Autor Prprio (2010)

18

Conforme Barbieri (2001) o Data Warehouse um banco de dados orientado


por assunto, no voltil, integrado e variante ao tempo. O alto nvel de complexidade
para o desenvolvimento de certos Data Warehouse, faz com que seja necessrio
iniciar o desenvolvimento atravs de Data Marts departamentais, que ao final, sero
integrados ao Data Warehouse.
2.2.5 Explorao dos dados
A explorao de dados a rea que se dedica a busca do conhecimento
atravs de grande quantidade de dados histricos. notrio que toda empresa
necessita de conhecimento, porm assegurado que existem passos anteriores
como a obteno de dados e consolidao destes em informao.
Segundo Bispo (1998) as decises so tomadas baseando-se em
comparaes e em tendncias; necessrio realizar-se anlises em diversas
perspectivas (dimenses) do negcio com o passar do tempo.
O Data Warehouse a fonte para a explorao dos dados, Data Mining e
OLAP so as tcnicas mais utilizadas.
Enquanto as tcnicas de OLAP objetivam trabalhar os dados existentes,
buscando consolidaes em vrios nveis, trabalhando fatos em dimenses
variadas, a tcnica de Data Mining busca algo mais que a interpretao de
dados existentes. Visa fundamentalmente realizar inferncias, tentando
como que adivinhar possveis fatos e correlaes no explicitadas nas
montanhas de dados de uma Data Warehouse / Data Marts (BARBIERI,
2001. Pag. 424).

Com a explorao dos dados pode-se utilizar as tcnicas de Data Mining e


OLAP, a fim de proporcionar uma melhor anlise dos dados.
2.2.5.1 Data Mining (Minerao de dados)
Segundo Bispo (1998), Minerao de dados (Data Mining) faz uso de tcnicas
de inteligncia artificial, lgica fuzzy, redes neurais e outras, que buscam nos
histricos, de uma empresa, padres e tendncias nos dados. Com o uso de
ferramentas de minerao possvel efetuar analises em grandes massas de dados
e como resultado descobrir relacionamentos, padres nas vendas gerando
condies para a empresa realizar uma boa tomada de deciso.

19

A tecnologia utilizada no Data Mining procura em grandes quantidades de


dados armazenados extrair padres e relacionamentos que podem ser fundamentais
para os negcios da empresa.
Para exemplificar, pode-se descobrir que clientes esto comprando
determinado produto, porque est comprando, a faixa etria dos clientes, qual
horrio que mais vende o local de venda de determinado produto, entre outros,
enfim, dados que antes eram obscuros aos olhos de um analista, com o Data Mining
so visveis.
2.2.5.2 OLAP (Online Analytical Processing)
OLAP uma ferramenta de Business Intelligence utilizada para apoiar as
empresas na anlise de suas informaes, visando obter novos conhecimentos que
so empregados na tomada de deciso.
Segundo Fonseca (2007) OLAP parte da tecnologia de Data Warehouse
que habilita usurios a explorar interativamente.
Bispo (1998) caracteriza a viso multidimensional dos dados um conceito
que pode parecer algo completamente abstrato; porm, mais natural, mais fcil e
intuitiva, permitindo a viso dos negcios da empresa em diferentes perspectivas e,
assim, transformando os usurios em exploradores de informaes.
O termo OLAP refere-se com objetivo final de transformar dados em
informaes capazes de suportar as decises gerenciais de forma amigvel e
flexvel ao usurio e em tempo hbil. OLAP trouxe uma grande capacidade de
efetuar clculos complexos como previses, percentuais de crescimento e mdias
diversas considerando-se a varivel tempo.
A tecnologia OLAP possibilita s organizaes um mtodo de acesso,
visualizao, e anlise de dados corporativos com alta flexibilidade e desempenho
Arajo (2007), por meio de relatrios e anlises a cubos de dados. Um cubo de
dados uma representao intuitiva do fato a ser analisado.
Partindo dos primrdios da informtica, quando um sistema que gerava
relatrios era a principal fonte de dados residentes na empresa, toda vez que uma
anlise necessitasse ser feita, eram produzidos novos relatrios. Estes relatrios

20

eram produzidos pela rea de informtica, precisavam de muito tempo para ficar
prontos e tambm, apresentavam os seguintes problemas: estticos e com acmulo
de diferentes tipos de relatrios num sistema gerava um problema de manuteno.
Os sistemas OLAP possibilitam efetuar diferentes tipos de consultas, eles
efetuam a explorao dos dados no Data Warehouse. Neste tipo de anlise
denominada multidimensional os dados so representados como dimenses em vez
de tabelas.
O OLAP uma soluo de ambiente, integrao e modelagem de dados. A
maioria dos dados de uma aplicao OLAP, originria de outros sistemas e fontes
de dados. Para formular a topologia e o projeto de uma soluo OLAP
multidimensional as seguintes perguntas devem ser feitas: Quando?, O qu?, Onde?
e Quem?. Essas perguntas formam a base de todos os campos multidimensionais. A
obteno dos dados originrios das respostas so destinados ao Data Warehouse e,
possivelmente para um ou vrios Data Marts.
As ferramentas OLAP so conhecidas pela sua flexibilidade, tem como
principal caractersticas a viso multidimensional dos dados, sendo capaz de
mostrar os dados de uma empresa atravs de vrias perspectivas, ou seja, onde
antes havia uma consulta simples em uma tabela relacional, agora se pode ter em
mos uma consulta onde vrias tabelas relacionadas ou no podem ser vistas,
manipuladas, comparadas e exploradas, a fim de identificar tendncias e conduzir os
negcios com preciso milimtrica nas decises.
Outra caracterstica do OLAP, que o diferencia da minerao, o fato de que
a relao entre os dados no apresentada diretamente, mas sim fornecendo uma
interface intuitiva para consultas do usurio, onde o mesmo interage com as
dimenses, faz consultas, verifica informaes em profundidade e compara as
informaes.
2.2.6 Cubos de dados OLAP
O conceito de cubo foi associado devido semelhana entre as tcnicas de
modelagem e a apresentao visual de um cubo. A diferena entre o cubo de 6
lados para o cubo OLAP, que o segundo no apresenta limite de dimenses

21

(lados) e medidas (tabela fato), sendo assim o primeiro serve apenas para conceito
de multidimenso.
O cubo possui dimenses e medidas associadas, e os dados so
armazenados na forma de clulas.
Um cubo de dados um tipo de matriz multidimensional que permite que os
usurios explorem a analisem uma coleo de dados de muitas
perspectivas diferentes, geralmente considerando trs fatores (dimenses)
de cada vez (KAY, 2010).

A Figura 6 apresenta os dados em forma de cubo de 6 lados, com trs


dimenses produto, local e tempo, ou seja, a quantidade vendida, pode ser
visualizada quanto pela data, como por produto vendido e local de venda, neste
caso podemos realizar consultas com n dimenses, usando a linguagem MDX, que
ser discutida nos prximos tpicos, e no se limitando a consultas simples como no
uso da linguagem SQL.

Figura 6: Cubo de dados


Disponvel in: Oracle (2010).

Quanto forma de visualizao dos dados no cubo, tem que ser explorado
para que todos os lados sejam visveis, visualizando assim as vendas de forma
dinmica e intuitiva, a figura 7 exibe a exploso do cubo de dados j a figura 8
mostra a sua forma de organizao.

22

Figura 7: Exploso do Cubo


Fonte: Autor prprio (2010)

Figura 8: Organizao da medida e dimenses.


Fonte: Autor prprio (2010)

O Data Warehouse ir servir como base para construo dos cubos


multidimensionais.
As consultas OLAP so consultas de agregao. Os analistas querem
respostas rpidas para estas consultas sobre conjunto de dados muito
grande natural considerar a computao prvia de vises
(RAMAKRISHNAN, 2008. Pag. 706).

Um cubo de dados constitudo por tabelas fatos e dimenses. As tabelas de


fatos representam o tema central do cubo e contm atributos que so medidas
numricas, pelas quais se quer analisar as relaes existentes entre as dimenses.
2.2.6.1 Tabela fato
No modelo multidimensional um fato representado por uma tabela fato. Uma
tabela fato constituda de valores quantitativos e numricos que representam um
assunto especifico no Data Warehouse.

23

Um conceito de tabela fato citado conforme Imhoff e Geiger (2003) uma


tabela fato a tabela dentro de um modelo dimensional que contm as medidas e
mtricas de interesse.
Segundo Inmon (1997) a tabela fato altamente indexada, ou seja, possui
muitos ndices. Em alguns casos todas as colunas da tabela fato so indexadas. O
resultado que se obtm indexando todos os dados uma tabela fato muito
acessvel. Como regra, a tabela fato no atualizada. Cada dado carregado
armazenado em um novo registro.
Conforme mostra a figura 9 a tabela vendas caracterizada como a tabela
fato.

Figura 9: Tabelas dimenses e Tabela fato


Fonte: Devmedia (2010).

2.2.6.2 Tabela dimenso


Uma dimenso se constitui de elementos que permitem caracterizar um
determinado fato, a figura 10 representa as dimenses ms, cliente, produto e
regio. Assim formando as dimenses da tabela fato vendas.

Figura 10: Tabela Dimenses


Fonte: Devmedia (2010)

24

Conforme Martins (2007), as informaes so do tipo, tempo, geografia,


produto, cliente entre outros. Sendo assim compostas por atributos e uma nica
chave primria, que interliga a tabela dimenso com a tabela fatos.
Uma tabela dimenso um conjunto de tabelas de referncias que
provem a base para restringir a agrupar consultas para informao
em uma tabela fato dentro de um modelo dimensional. A chave da
tabela dimenso tipicamente uma parte da chave concatenada da
tabela fato, e tabela dimenso contm informao descritiva e
hierrquica (IMHOFF, GALEMMO E GEIGER, 2003, p.400).

Um modelo dimensional deve responder a algumas perguntas sobre o fato,


onde aconteceu, quando aconteceu, o que aconteceu, e com quem aconteceu, a
Figura 11 ilustra este modelo.

Figura 11: Representando as dimenses do fato.


Fonte: Machado (2004, pg. 115).

Na viso de usurio, a tabela dimenso pode ser descrita como uma viso ou
perspectiva do modelo analisado, pode-se dizer ento que seria a pergunta de um
determinado modelo de negcio, onde a resposta seria apresentada na tabela fato.
2.2.6.3 Tcnicas de Modelagem
Segundo

Felber

(2005),

existem

vrias

tcnicas

de

modelagem

multidimensional e relacional, dentre elas, as mais utilizadas so: Star Schema


(esquema estrela) e Snowflake (esquema flocos de neve).

25

Star Schema (esquema estrela)

A tabela de fatos conecta-se as demais por mltiplas junes, e as tabelas de


dimenses se conectam com a tabela de fatos com apenas uma juno, como
mostra a Figura 12.

Figura 12: Representa a disposio das dimenses no modelo estrela


Fonte: Machado (2004, pg. 93)

De acordo com Colao (2004) como o prprio nome j diz, ele tem
semelhana com uma estrela, sendo que composta por uma grande entidade, ou
melhor, uma tabela central dominante, chamada de tabela fato. No conjunto de
entidades, ou tabelas menores, que so arranjadas ao redor da tabela de fato, so
denominadas tabelas de dimenso.

Snowflake (esquema de floco de neve)


O modelo Floco reduz o espao de armazenamento dos dados dimensionais,

mas acrescenta vrias tabelas ao modelo, conforme mostra a figura 13.


O modelo floco de neve o resultado da decomposio de uma ou mais
dimenses, que possui hierarquia entre seus membros, pode se definir
relacionamentos muitos para um entre os membros de uma dimenso,
formando, por meio desses relacionamentos entre entidades de dimenso,
uma hierarquia o resultado da aplicao da terceira forma normal sobre as
entidades de dimenso (MACHADO, 2000, p. 74).

26

Figura 13: Representa a disposio no modelo Flocos de Neve


Fonte: Machado (2004, pg. 94)

O Modelo deixa mais complexa a explorao dos dados, tornando mais difcil
a navegao pelos softwares que utilizaro o banco de dados.
2.2.6.4 Operaes em cubo OLAP
As caractersticas presentes nas ferramentas OLAP a forma de operar os
dados, como por exemplo, as operaes de tipo, segundo Arajo (2007):

Slice and Dice

uma das principais caractersticas de uma ferramenta OLAP. Modifica a posio


de uma informao dentro do cubo atravs da troca de linhas e colunas.

Drill Down

Aumenta o nvel de detalhe da informao consultada.

Drill Up

Diminui o nvel de detalhe da informao.

Drill Across

Passa de um nvel para outro na dimenso pulando algum nvel intermedirio.

27

Drill Through

Passa de uma informao contida numa dimenso para outra.


Outras operaes que podem ser encontradas no OLAP, mas com objetivos
mais especficos so Drill Out, Drill Within, Sort, Ranking, Pivoting, Paging, Filtering,
Tiling, Alerts, Break.
2.2.7 Linguagens
Nos cubos OLAP, destaca-se as linguagens, MDX Para realizar consultas
multidimensionais, e para padronizao dos cdigos de busca o XML.
2.2.7.1 XML (Extensible Markup Language)
O Extensible Markup Language (XML) surgiu com o principal intuito de
padronizao do cdigo e segundo Benedito (2010), suas principais caractersticas
so buscas mais eficientes, desenvolvimento de aplicaes flexveis para web,
integrao de dados de fontes diferentes, computao e manipulaes locais,
mltiplas formas de visualizar os dados, atualizao granulares dos documentos,
fcil distribuio da WEB, escalabilidade e flexibilidade, separao do contedo da
formatao, possibilidade de criao de tags sem limitao, interligao de banco de
dados distintos, legibilidade do cdigo.
Extensible Markup Language (XML) linguagem de marcao de dados
(meta-markup language) que prov um formato para descrever dados
estruturados. Isso facilita declaraes mais precisas do contedo e
resultados mais significativos de busca atravs de mltiplas plataformas. O
XML tambm vai permitir o surgimento de uma nova gerao de aplicaes
de manipulao e visualizao de dados via internet (BENEDITO, 2010).

2.2.7.2 MDX
A Linguagem MDX semelhante linguagem SQL, porm possibilita
consultas multidimensionais, diferente da SQL onde possvel efetuar consultas
com no mximo duas dimenses.
Linguagem de consulta base de dados multidimensionais criada pela
Microsoft em 1998, semelhante linguagem SQL, parte de um padro
industrial, o OLE DB for OLAP. Permite a especificao de at 128 eixos de
consultas, sendo, porm incomum a utilizao de mais de 3 eixos
(TENORIO, 2010).

A linguagem MDX se torna uma fundamental caracterstica das consultas em


cubos OLAP, pela sua dinmica multidimensional.

28

2.2.8 Ferramentas OLAP


No mercado de BI (Business Intelligence) existem inmeras ferramentas de
solues para OLAP, que proporcionam as empresas condies e caractersticas
prprias para realizarem apoio tomada de deciso, como solues SQL SERVER,
ORACLE, IBM, etc.
Estas ferramentas proprietrias fornecem solues somente para seus
SGBDS, forando as empresas utilizar estes recursos. Surge ento s ferramentas
gratuitas como o PENTAHO, uma ferramenta sob licena livre capaz de operar com
a maioria dos SGBDS existentes no mercado.
2.3 PENTAHO uma ferramenta Open Source de BI
O Pentaho Open Source Business Intelligence de acordo com Pentaho (2010)
uma plataforma completa de Business Intelligence (BI), desenvolvida, distribuda e
implantada como cdigo aberto, que inclui recursos de gerao de relatrios,
integrao e armazm de dados (Data Warehouse), anlise de informaes em
tempo real, painis de controle gerencial, minerao de dados (Data Mining) e
modelos estatsticos. Essa soluo, atualmente, a mais popular dentre as solues
de BI em cdigo aberto do mundo. Ela distribuda em duas verses: a verso
Community (livre, gratuita) e a verso Enterprise (paga). A plataforma Pentaho
composta por vrios componentes que podem ser usados integrados, como um
pacote de solues, ou isoladamente, para atender necessidades especficas.
2.3.1 A Plataforma
A soluo Pentaho define-se a si mesma como uma plataforma de BI
orientada para a soluo e centrada em processos. Ou seja, no s apresenta os
resultados de uma forma nica e dando uma viso geral do estado da empresa,
como implementa os prprios processos (workflow) para a resoluo de problemas
detectados e apresentados. Segundo Pentaho (2010) a Pentaho Inc. integrou e
promoveu o desenvolvimento de ferramentas open source que fornecem os recursos
para criao de solues de BI. O conjunto conhecido por Pentaho Open BI Sute
(ou Sute Pentaho), incluem as sutes Reporting (Relatrios), Analysis (Explorao
dos dados), Data Integration (Extrao dos dados), Dashboards (Relatrios
personalizados) e Data Mining (Minerao de dados). Devido sua estrutura em
componentes, a Sute pode ser utilizada para atender demandas que vo alm do

29

escopo das Solues de BI mais tradicionais. A figura 14 ilustra o processo da


plataforma do Pentaho Open BI Sute, o presente trabalho utilizou-se da verso 3.5.

Figura 14: Plataforma Pentaho Open BI Sute


Fonte: Miranda (2010)

As principais funcionalidades disponveis, segundo Felber (2005) so:

Relatrios (Reporting): Fornece desde simples relatrios em uma pgina


WEB, relatrios de alta qualidade tais como relatrios de indicaes
financeiras e relatrios ricos em contedos como tabelas, grficos entre
outros.

Anlises (Analysis): Permite consultas de explorao interativa com


operaes slice-and-dice, drill-down e pivoting. Para explorao dos cubos
OLAP.

Painis (Dashboards): Renem relatrios, anlises e outras exposies em


um nico local para simplificar o acesso, podendo ser customizado por
usurio, role ou assunto.

Data Mining: Descobre relacionamentos ocultos nos dados, que podem ser
utilizados para otimizar os processos de negcio e prever resultados futuros.

30

Permite que os resultados sejam exibidos em um formato de fcil


entendimento ao usurio.

Workflow: Liga diretamente as medidas de desempenho de negcio aos


processos, promovendo um ciclo contnuo de melhorias.

2.3.2 Caractersticas
Conforme Pentaho (2010) O Pentaho reuniu inmeras caractersticas que o
faz ser o software livre de BI (Business Intelligence), mais utilizado no mercado,
entre as principais esto:

Preo: O Projeto Pentaho considerado Open source, ou seja, o programa


distribudo gratuitamente com seu cdigo-fonte aberto.

Usabilidade: A plataforma BI tem componentes de fcil integrao com


sistemas externos, e oferece interfaces de fcil customizao.

Orientao a ferramentas: A plataforma de BI centrada em processos e


solues. Ela no projetada para ser um conjunto de ferramentas isoladas,
um sistema completamente integrado.

Extenso: O cdigo fonte fornecido. A infra-estrutura, componentes,


mecanismos e interfaces podem ser facilmente modificados.

Foco em relatrios: A plataforma pode ser facilmente integrada aos processos


de negcios e tem facilidades para a gerao de relatrios. Regras de
negcios so usadas para identificar problemas e excees.

2.3.3 Ferramentas
A plataforma Pentaho composta por vrios componentes que podem ser
usados integrados, como um pacote de solues, ou isoladamente, para atender
necessidades especficas que so segundo Pentaho (2010):
Mondrian Servidor OLAP
Jpivot Visualizao de cubos multidimensionais.
Weka Minerao de dados
Kettle Integrao de dados
JFreeReport Gerador de relatrios

31

Schema Workbench Criao dos cubos

Mondrian
De acordo com Neto (2008) o Mondrian um servidor OLAP, escrito em Java,

e que foi incorporado como ferramenta ao pacote Pentaho. Ele executa consultas
escritas na linguagem MDX e converte para SQL, lendo dados de bases relacionais
e apresentando os dados no formato multidimensional, atravs de uma API Java.

JPivot
Um das principais ferramentas que realizam a comunicao entre Mondrian e

usurio o Jpivot, uma interface grfica desenvolvida em Java com cdigo aberto,
para visualizao de cubos multidimensionais. atravs dele que so feitas as
consultas no cubo e tambm onde o cubo visualizado, a figura 15 apresenta-se
algumas funcionalidades do Jpivot.

Figura 15: Barra de ferramentas JPivot


Fonte: Autor Prprio (2010)

1:

Esta opo permite colocar as dimenses em linhas, colunas ou passar por

filtros. Os filtros, tambm conhecidos como Slicer (fatiar) permitem filtrar os dados
contidos em uma dimenso membro, coloc-los em diferentes posies para melhor
anlise.
2:

Esta opo permite a visualizao e / ou editar a MDX para a atual consulta.

3:

Permite organizar os valores dos campos em ordem crescente ou

decrescente, mostrar ou ocultar membros.


4:

Mostra os membro (s) pai de uma consulta em uma linha.

5:

Impede a exibio de cabealhos repetidos ou que retornem valor zero, do

tipo All produto, fazendo com que assim mltiplos campos da prxima dimenso
sejam relacionadas com apenas um campo.
6:

Inverte colunas/linhas ou linhas/colunas

32

7-8-9: Botes de Drill up e Drill down, que controlam o comportamento de uma query
de diferentes modos de detalhamento.
10:

O Drill Through adiciona uma seta indicativa nas medidas que possibilitem

uma visualizao mais especifica.


11:

Mostra o grfico referente a consulta atual.

12:

Configura o grfico, deixando personalizado da forma que o usurio desejar.

13:

Configurao de impresso.

14:

Exporta para PDF.

15:

Exportar para o Excel.


O Jpivot permite realizar toda a explorao atravs das tabelas do cubo e a

analise das mesmas, a figura 16 ilustra a visualizao de um cubo de dados no


Jpivot:

Figura 16: Visualizao dos dados com o JPivot


Fonte: Autor Prprio (2010)

Weka
O Weka um ambiente grfico para Data Mining. Segundo Pentaho (2010)

Permite ao usurio criar e testar hipteses contra as bases de dados. Existem


grandes potencialidades na utilizao de Data Mining para apoiar o processo de
tomada de deciso.

33

Kettle
Faz parte da sute do Data Integration, e utiliza as tcnicas de ETL, para a

obteno dos dados que viro das vrias fontes de dados, e que obrigatoriamente
teremos de cruz-las em algum momento dentro do ciclo de ETL. Conforme Pentaho
(2010) o Kettle capaz de ler e escrever em vrios formatos de SGBD, como
Oracle, PostgreSQL, SQLServer, MySql, entre outros, e importar arquivos texto (csv
ou fixo), planilhas Excel e bases de dados ODBC (apenas em Windows). Ele um
ambiente grfico no qual conexes com fontes de dados so estabelecidas e
seqncias de passos executam a extrao de dados, sua modificao e a carga
desses em um destino. O Kettle pode integrar dados entre empresas e sistemas,
substituindo a criao de camadas de programas para integrao por operaes
visuais.

JFreeReport
Uma das principais funcionalidades a gerao de indicadores, como

grficos e painis (Dashboards), os dois podem ser conectados a uma base de


dados em uso, e apresentar os dados em tempo real. Os grficos podem ser criados
com modelos pr-definidos ou via Wizard com o sistema Report design, que se deu
origem atravs do JFreeReport, tudo com uma interface fcil e intuitiva.

Schema Workbench
O Schema Workbench cria os cubos no formato XML que sero processados

e exibidos pelo Pentaho. Ele tem uma interface visual para navegar entre as
definies do cubo, permitindo criar, alm de mtricas, dimenses e hierarquias,
muitas das estruturas que agregam valor na explorao de um cubo OLAP, como
mtricas derivadas, cubos virtuais (combinaes de tabelas fato) e atributos de
dimenses, a figura 17 exibe a tela do Schema Workbench, cujo foi desenvolvido em
java.

34

Figura 17: Criao do cubo no Schema Workbench


Fonte: Autor prprio (2010)

No prximo tpico ser apresentada a ferramenta de estatstica SPSS, que


realiza a anlise dos dados estatisticamente para apoiar a tomada de deciso, alm
disso, ser abordada a tcnica de Anlise de varincia (Anova) utilizada para
comparar medidas e variveis.
2.4 SPSS (Statistical Package for the Social Sciences)
O software SPSS (Statistical Package for the Social Sciences) permite realizar
clculos estatsticos complexos, visualizar resultados de forma rpida permitindo
assim aos seus usurios uma apresentao e uma interpretao sucinta dos
resultados obtidos atravs de tcnicas estatsticas, conforme Martinez e Ferreira
(2007) com o SPSS possvel criar, definir e modificar variveis, conhecer o nmero
de casos e calcular percentuais para cada uma das variveis existentes, calcular
medidas simples e mltiplas, realizar cruzamentos de variveis, gerar os mais
diversos tipos de grficos, verificar a existncia de associaes e/ou correlaes
entre variveis, executar anlises de varincia, e muito mais, a imagem 18 exibe a
tela inicial do SPSS, cuja apresenta semelhanas com o Microsoft Excel.

35

Figura 18: SPSS ela Inicial


Fonte: Gerado pelo SPSS (2010)

O SPSS pode ser utilizado nas mais diversas reas do conhecimento e


aplicaes, tais como, marketing, psicologia, administrao, educao, cincias
sociais, servio social, economia, finanas, sade pblica, pesquisa de mercado,
pesquisa social, pesquisa eleitoral, pesquisa de opinio, pesquisa de mdia, entre
vrios.
O software proprietrio da empresa IBM, sua licena paga, a ultima
verso atual do software a 18.0, o sistema trabalha somente na plataforma
Windows, as anlises realizadas no sistema utilizaro somente menus e caixas de
dilogos como mostra a figura 18, uma das principais tcnicas utilizadas no software
a Anova (Anlise de varincia).
2.4.1 Anlise de varincia (Anova)
uma tcnica estatstica cujo objetivo decidir se existem ou no diferenas
significativas entre as mdias de vrias amostras de uma varivel numrica,
definidas por diferentes tratamentos.
De acordo com Naresh (2004) na forma mais simples pode ter somente uma
varivel dependente (sofre efeitos do tratamento), que seja mtrica. Deve haver
tambm uma ou mais variveis independentes ( a causa ou tratamento numa interrelao).

36

A sada final do teste de Anova exibida atravs de uma tabela, onde consta
a significncia encontrada para tal teste, isto significa que a probabilidade mxima
de rejeitar acidentalmente uma hiptese nula ou verdadeira, como mostra a figura
19:

Figura 19: tabela Anova


Fonte: Gerado pelo SPSS (2010)

Conforme Aaker e George (2007) a tabela Anova uma forma convencional


de apresentar um teste de hiptese que trate das diferenas entre diversas medias,
se a significncia for acima de 0,05 isto expressa que no tem relao entre as
variveis (resultado nulo), caso o valor for abaixo, mostra-se ento que possui
relao entre as mesmas (resultado verdadeiro).

37

3. ESTUDO DE CASO
O Estudo de caso aplicou-se a soluo de BI ao Grupo de Postos de
Combustveis Pioneiro. A soluo resume-se na construo de um cubo OLAP, onde
o mesmo explora uma grande massa de dados precisos e rpidos, referente s
vendas ocorridas entre os anos de 2009 e 2010 e a comparando com os feriados e
eventos socioeconmicos, A anlise de vendas tem o propsito de servir como
subsidio para uma melhor tomada de deciso de gerentes e gestores.
3.1 A Empresa
O Grupo de postos de Combustveis Pioneiro uma empresa revendedora
dos produtos da empresa AleSat Combustveis S.A. (Grupo ALE) a quarta maior
distribuidora de combustveis do Brasil.
O Grupo Pioneiro uma empresa de mdio porte com um total de 13
colaboradores, atuando desde 2003 no estado do Maranho nas cidades de Balsas
e Aailndia.
Para fins de gerenciamento como mostra a figura 20 o grupo utiliza um
sistema web desenvolvido em PHP que utiliza banco de dados MYSQL, ao todo so
33 tabelas que realizam o armazenamento dos dados dirios de controle de
estoque, vendas e financeiro, o sistema no utiliza o conceito de BI (Business
Intelligence) deixando o gestor limitado explorao de dados, dificultando os
cenrios que possam vir a acontecer com o decorrer das vendas.

Figura 20: Sistema Web


Fonte: Autor Prprio (2010)

38

Diversos relatrios so gerados por dia com pouco poder de estabelecer uma
anlise dinmica e intuitiva, quando se espera uma anlise de todas as vendas do
ano o fluxo de informaes a serem processadas pelo sistema. Se torna-se lento e
demorado ocasionando o travamento, a arquitetura do ambiente do sistema
representada pela figura 21.
Uma das principais caractersticas da aplicao utilizada na empresa a
mobilidade, pode-se ser utilizada em qualquer lugar que esteja, caso tenha acesso a
internet, com isso facilita a consulta dos dados atuais.

Figura 21: Arquitetura da aplicao


Adaptao de: Linha de cdigo (2010).

A figura 22 mostra que os relatrios atuais no disponibilizam uma consulta


multidimensional (produto, filial, tempo, vendas), somente consultas SQLS de duas
dimenses. No agregam em um nico relatrio todos os dados das empresas do
grupo.

39

Figura 22: Relatrio de vendas


Fonte: Autor Prprio (2010)

Para solucionar o problema de anlise da empresa, foi proposto a criao de


um ambiente de explorao OLAP para analisar os dados das vendas realizadas no
perodo de 2009 e 2010.
3.2 As vendas
A realizao das vendas do grupo apresenta ndices de varincias com
decorrer de cada ms, sem uma anlise mais detalhada, os dados somente
apresentavam condies aos gestores realizarem pequenas tomadas de decises
sem favorecer o seu produto e at mesmo o seu cliente, neste cenrio os feriados e
eventos socioeconmicos que por ventura poderiam ou no contribuir para o
aumento das mesmas, no eram mensurados e nem to pouco acompanhados
como fatores chaves de sucesso.
Os produtos vendidos se constituem de gasolina comum, gasolina aditivada e
diesel na filial da cidade de Balsas MA (Posto Modelo) e na matriz em Aailndia
MA (Posto Pioneiro) gasolina comum e diesel, o cenrio de vendas em cada uma
das cidades so bastante diferentes por questes sociais e econmicas. Balsas
MA agricultura se prevalece e movimenta a regio, j em Aailndia MA o setor de
indstria e siderrgicas fortalecem a economia local.
As vendas em ambas as cidades so divididas em dois turnos, matutino que
reflete ao horrio de 05h00min da manh at s 13h00min da tarde, e vespertino
que inicia s 13h00min at 22h:00min, o pblico alvo no grupo est relacionado a
veculos automotores de pequeno porte como motocicletas, carros e caminhonetes.

40

O processo de registro de vendas no sistema se estabelece em fechamentos


de turnos, ou seja, no final de cada turno o responsvel passa para a rea
administrativa o valor final de litros de cada bomba, aps a conferncia os dados so
lanados no sistema. A cada dia se estabelece o fechamento dos turnos.
3.3 A soluo
Procurando uma soluo para o problema encontrado, buscou-se a
construo de um cubo OLAP, referenciando s vendas do Grupo Pioneiro, que
permitisse uma anlise intuitiva dos dados armazenados no perodo de 2009 e 2010,
bem como anlise comparativa com os fatores socioeconmicos das cidades de
Balsas-MA e Acailndia-MA.
Foi necessrio realizar um processo dividindo em oito fases, desde o
detalhamento dos dados a serem explorados, bem como a descrio de cada campo
do relatrio ofertado, alm da identificao dos dados do negcio, extrao e
transformao e carga dos dados (ETL), armazenamento e anlise com os aspectos
socioeconmicos de cada cidade, fornecendo assim um cenrio mais probabilstico
para uma boa tomada de deciso.
Para iniciar o projeto a primeira etapa foi realizada uma entrevista com o
gestor para definir quais as reais necessidades do grupo, neste processo foi
identificada a necessidade de explorar as vendas de ambas as empresas, pois os
relatrios atuais que o sistema da empresa apresentava, no geravam condies
satisfatrias para uma anlise fcil e intuitiva de ambas filiais do Grupo ao mesmo
tempo, dificultando a tomada de deciso, a figura 23 mostra o relatrio de vendas da
filial de Aailndia-MA no sistema atual.

Figura 23: Relatrio de Vendas


Fonte: Autor Prprio (2010)

41

As dimenses a serem exploradas sero tempo, filial, produto, turno,


definindo-se o modelo de explorao dos dados das vendas, o tempo ser dividido
em ano, ms e dia, facilitando a anlise dos dados. A soluo permitir a anlise dos
dados como, quantidade vendida por filial, por data, produto e turno, assim como as
suas tendncias em determinados turnos e perodos de tempo.
Com a delimitao do problema, iniciou-se ento a formalizao das
dimenses que formaro o cubo, para confirma o modelo de negcio a ser
explorada, a figura 24 exibe a modelagem multidimensional proposta.

Figura 24: Dimenses do Cubo


Fonte: Autor Prprio

A segunda etapa se iniciou com um estudo no Data Warehouse que o grupo


possua, para validar se a modelagem atual se adequava para as solues
multidimensionais, a figura 25 exibe as tabelas exploradas no cenrio de vendas, no
total foram identificadas 6 tabelas (gasolina_aditivada, gasolina, diesel, caixa,
valores e turno) nas 33 existentes.
Foram utilizadas as tabelas (gasolina_aditivada, gasolina, diesel, caixa,
valores e turno) devido a sua prevalncia no processo de negcio do grupo, cujo
necessita das informaes correspondentes as tabelas para finalizar o faturamento
das vendas ocorridas durante o dia.

42

Figura 25: Tabelas do Data Warehouse vendas


Fonte: Autor Prprio(2010)

Com as tabelas extradas foi identificado que na forma de modelagem que o


contexto de vendas estava no era propcia para uma explorao multidimensional
do cubo OLAP, pois a modelagem de cubo OLAP necessita de uma Tabela Fato e
tabelas dimenses, com isso se se tornou necessrio a criao de um Data Mart de
vendas, na qual ir armazenar os dados dos dois Data Warehouses do grupo,
centralizando as informaes, facilitando assim a explorao dos dados de forma
mais simples e objetiva.
A terceira etapa do processo se iniciou com a criao de um Data Mart, foi
criado para centralizar as informaes de vendas em uma nica base de dados, com
base na modelagem do tipo Star Schema, foi desenvolvido neste modelo devido a
facilidade de criao de um ambiente de explorao de um cubo OLAP no mesmo, o
modelo de relacionamento no Data Warehouse do grupo foi quebrado e dando
origem a um novo modelo de relacionamento no Data Mart, como mostra a figura 25,
ele apresenta a tabela fato (vendas) juntamente com as tabelas dimenses (tempo,
turno, produto, filial).

43

Figura 26: Data Mart Vendas


Fonte: Autor Prprio(2010)

Com o Data Mart construdo e as dimenses definidas, iniciou a quarta etapa,


que se define como a transformao dos dados armazenados nos Data Warehouses
para o Data Mart central, este processo de ETL considerada uma das principais
etapas, pois os dados sero extrados e transformados para as consultas, para
realizar este processo de forma intuitiva e automtica foi desenvolvido um framework
em PHP, que constitui em uma pgina web capaz de extrair os dados dos Data
Warehouses para um Data Mart dinamicamente, a figura 27 mostra o framework
construdo, ao todo foram mais de 10.000 registros explorados e transformados.

44

Figura 27: Framework em PHP para importao de dados


Fonte: Autor Prprio (2010)

No momento que o boto Deploy e acionado, os dados comearo a ser


processados conforme o processo de ETL citado no item 2.2.2, nesta etapa de
filtragem, dados nulos, com campos incorretos ou duplicados, foram identificados e
descartados, o filtro executado pelo framework, cada boto referencia um tipo de
produto vendido para cada filial, aps os dados so armazenados no Data Mart de
vendas.
O modelo do banco dimensional no suficiente para o Pentaho identificar os
cubos e dimenses. necessrio criar um arquivo XML descrevendo quais so os
cubos e dimenses e suas respectivas tabelas associadas, para isto a quinta fase se
inicia, com a configurao do Data Mart no Schema Workbench, a figura 28 exibe a
configurao utilizada no trabalho.

Figura 28: Configurao para conexo com banco de dados


Fonte: Gerado pelo Schema Workbench (2010)

45

A configurao deve ter como parmetro o driver de conexo Java, alm da


URL de conexo, assim como o usurio e password da base de dados.
O Schema Workbench um software de criao de cubos OLAP que faz
parte do pacote de sute do Pentaho, a sua escolha foi devido a sua interface
amigvel tornando o desenvolvimento mais intuitivo, a figura 29 exibe a visualizao
da montagem do cubo.

Figura 29: Criao do cubo


Fonte: Gerado pelo Schema Workbench (2010)

Todas as tabelas utilizadas para a montagem do cubo so do Data Mart de


vendas criado, as dimenses a serem exploradas foram definidas como filial,
produto, tempo e turno, como medidas foram consideradas o total de litros e total em
reais, assim foi atribudo o agregador sum, para realizar a somatria dos dados
explorados conforme o cenrio analisado, a figura 30 exibe mais detalhado o
esquema montado para o cubo OLAP.

46

Figura 30: Criao do cubo OLAP com as dimenses


Fonte: Gerado pelo Schema Workbench (2010)

O Schema Workbench por fim, publicar este esquema montado do cubo


atravs de um arquivo XML para o servidor Mondrian, que ser o responsvel pela
interpretao do Schema no Pentaho e interpretar as consultas Multidimensionais.
Para o Pentaho realizar o acesso ao Data Mart necessrio realizar a
configurao de acesso a base, a figura 31 ilustra a configurao da base de dados
com o Pentaho, uma das principais caractersticas que pode-se realizar a conexo
com vrios tipos de banco de dados como Firebird, Mysql, Oracle, SqlServer etc.

47

Figura 31: Configurao com o Data Mart


Fonte: Gerado pelo Pentaho (2010)

Aps a publicao do arquivo XML do Schema do cubo, comea a sexta fase


que realiza a interpretao do cubo montado com os dados do Data Mart de vendas,
conforme a figura 32 .

Figura 32: New Analysis View para visualizao do Cubo Olap


Fonte: Gerado pelo Pentaho (2010)

48

O Analysis View utiliza como cliente o JPivot e a engine do Mondrian. Exibe a


Interface final do usurio, o software prov os recursos necessrios para o
gerenciamento de dados do Data Mart de forma fcil e dinmica facilitando a anlise
do cubo, o Mondrian configurado atravs de esquemas montados no Workbench,
o principal responsvel interpretao das consultas MDX no cubo de dados, as
consultas MDX so realizadas online, sendo exibida no prprio JPivot, a figura 33
exibe um exemplo de consulta MDX no Data Mart de vendas .

Figura 33: Consulta MDX


Fonte: Gerado pelo Pentaho (2010)

Se iniciou o processo de visualizao do cubo de dados (stima fase) atravs


do Analysis View criado, o JPivot possibilita o carregamento das definies do cubo,
assim como a toolbar, que manipula as informaes, afim de permitir segmentar a
informao por eixos de anlise, permitindo a anlise da informao com base em
vrias perspectivas. Com isso possvel a compreenso das informaes de uma
forma mais intuitiva, uma vez que a soluo permite decompor os valores nas
diferentes perspectivas de anlise, a figura 34 representa o cubo com os dados do
Data Mart.

Figura 34: Visualizao do Cubo OLAP


Fonte: Gerado pelo Pentaho (2010)

49

O cubo foi fatiado exibindo as dimenses criadas como filial, produto, tempo e
turno assim como as mensuraes de total em litros vendidos e total em reais.
Como resultado, pode-se observar quanto uma determinada venda por filial
(Balsas-MA e Aailndia-MA), representaram em relao ao total de vendas em
litros vendidos e em reais, assim como por produto (gasolina comum, gasolina
aditivada e diesel), tempo (dia, ms e ano), e turno (matutino e vespertino), a forma
de visualizao dos dados se torna fcil, melhorando o entendimento do contexto de
vendas do grupo ao gestor da empresa, dessa forma podendo realizar comparaes
de vendas entre as filiais distintas para uma perspectiva de anlise de tomada de
deciso baseado nos dados armazenados no Data Mart Central. Este cubo tem o
principal intuito de servir como fonte de informaes sobre as vendas ocorridas em
2009 e 2010, para tanto, a figura 35 apresenta o cubo que demonstra o resultado
desta operao com as informaes armazenadas no Data Mart de vendas.

Figura 35: Explorao do cubo OLAP com o Pentaho


Fonte: Gerado pelo Pentaho (2010)

50

Observar-se ento, que nas dimenses filial, produto, tempo e turno, quando
se apresenta o sinal de + podemos navegar para dentro do cubo, realizando uma
tcnica de drill down, visualizando dados mais detalhados, como no caso acima
demonstrado, onde foi selecionado o tempo do produto diesel da filial de AailndiaMA, que por sua vez, pode-se especializ-los ainda mais, mostrando os meses e
dias que houve vendas no ano. O mesmo caso ocorre na dimenso produto, onde
quando selecionado um produto disponvel, pode expandir os dados, de forma que
se apresentam as filiais onde ocorreram vendas naquele produto selecionado.
Conforme mostra a figura 36 os dados e grficos, tem-se a possibilidade de
analisar eventos ocorridos durante as vendas, verificando o impacto ocorrido na
empresa, assim como questionamentos do tipo:

Figura 36: Visualizao dos dados das vendas


Fonte: Gerado pelo Pentaho (2010).

51

Qual filial vendeu mais durante o ano de 2009 e 2010?

Qual produto teve menos vendas e em qual filial?

Em que perodo, verifica-se fortemente os efeitos dos feriados e eventos


socioeconmicos e quando a empresa apresentou sinais de melhoria nas
vendas?

Quais filiais o grupo deve concentrar suas vendas?


Com esta soluo, podem-se responder estas perguntas, e tantas outras,

agregando, assim, conhecimento sobre as vendas do Grupo de Postos de


Combustveis Pioneiro bem como tomar melhores decises.
3.4 Relaes entre vendas com feriados e fatores socioeconmicos
Alm de realizar todo o processo de montagem do cubo bem como a extrao
dos dados, finalizou-se com a oitava fase que relacionar os dados das vendas
entre o perodo de abril de 2009, pois foi quando se iniciou a utilizao do sistema
de gerenciamento do grupo, at outubro de 2010 que foi o perodo final dos dados
explorados, esta relao trs dois parmetros que so os feriados e fatores
socioeconmicos, estes foram divididos por cada cidade correspondente a filial do
Grupo, com isso pode-se responder certas perguntas que ficavam a merc do
gestor, como por exemplo, ser que no perodo do carnaval as minhas vendas sero
boas, devido a este evento? Para isto foram listados e classificados todos os
feriados e fatores socioeconmicos que podem ter relao com as vendas em um
determinado perodo por regio.
Os feriados e fatores socioeconmicos nos perodos de 2009 e 2010, sempre
ocorreram nos mesmos meses, para definir melhor como avaliar este cenrio, foi
realizado a classificao dos mesmos e associando determinados pesos para cada
um. Os feriados foram associados o peso no valor de 1 ponto, devido a pouca
movimentao de pessoas durante este perodo na cidade em relao a outros
fatores, j os socioeconmicos associou-se o peso no valor de 2 pontos, isto se da
pela relao de quantidade de pessoas que circulam na cidade durante este
perodo, como exemplo pode-se citar o carnaval fora de poca, Agrobalsas, festejo
da cidade, entre outros, a tabela 1 abaixo mostra toda a classificao da cidade de
Balsas-MA.

52

Tabela 1: Listagem dos feriados e Fatores socioeconmicos de Balsas-MA

FERIADOS

Confraternizao Universal (Virada de ano)


Carnaval
Paixo de Cristo
Pscoa
Tiradentes
Dia do trabalhador
Corpus Christi
Independncia do Brasil
Dia das crianas
Finados
Proclamao da Repblica
Natal
Dia dos namorados

FATORES

Pr-Carnaval
Aniversrio de Balsas
Raly dos Sertes
Festejo da cidade de Balsas
Frias
Agrobalsas

Fonte: Autor Prprio (2010)

Foi distribuda a categorizao dos feriados e fatores nos meses de janeiro a


dezembro totalizando o peso de cada ms, conforme mostra a tabela 2:
Tabela 2: Distribuio dos feriados e fatores para cidade de Balsas-MA
BALSAS-MA
Eventos
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
Confraternizao Universal (Virada de ano) 1
Pr-Carnaval
2
Carnaval
1
Paixo de Cristo
1
Pscoa
1
Tiradentes
1
Dia do trabalhador
1
Corpus Christi
1
Independncia do Brasil
1
Dia das crianas
1
Finados
1
Proclamao da Repblica
1
Natal
1
Aniversrio de Balsas
2
Raly dos sertes
2
Festejo da cidade de Balsas
2
Frias
2
Agrobalsas
2
Dia dos namorados
1
Total
3 1
2 3 3 6 2 0 1 1
2
1
Fonte: Autor Prprio (2010)

53

Com a categorizao dos feriados e fatores socioeconmicos da cidade de


Balsas-MA e com a distribuio nos perodos de janeiro a dezembro, foi
demonstrado que o perodo que tem o maior peso o ms de junho que acumulou o
total de 6 pontos, desta maneira pode ser que durante este perodo os feriados e
fatores podem influenciar no aumento das vendas, ao contrrio do ms de agosto
que totalizou a peso de 0 pontos, possivelmente neste perodo as vendas no iro
ter o mesmo movimento.
O mesmo processo de categorizao dos feriados e fatores socioeconmicos
foi realizado para a cidade de Aailndia MA, divido com a mesma pontuao de
Balsas-MA, conforme mostra a tabela 3:
Tabela 3: Listagem dos feriados e Fatores socioeconmicos de Aailndia-MA

FERIADOS

FATORES

1
Confraternizao Universal (Virada de ano)
Paixo de Cristo
Pscoa
Tiradentes
Dia do trabalhador
Dia das Mes
Corpus Christi
Dia dos namorados
Dia dos Pais
Independncia do Brasil
Dia das crianas
Finados
Proclamao da Repblica
Natal

2
Aaifolia (Carnaval fora de poca)
Aniversrio de Aailndia
Expo Aai (Exposio)
Frias
Festejo da cidade de Aailndia-MA

Fonte: Autor prprio (2010)

A cidade de Aailndia MA j apresenta fatores diferenciados da cidade de


Balsas MA como o carnaval fora de poca (Aaifolia), exposio (Expo Aai), entre
outros, estes fatores podem diferenciar o aumento de vendas devido grande
circulao de pessoas nestes perodos na cidade, a distribuio foi realizada no
perodo de janeiro a dezembro conforme mostra a tabela 4, sendo que no final de
cada ms foi realizada a totalizao dos mesmos.

54

O perodo que apresentou o maior peso em relao aos feriados e os fatores


socioeconmicos foi o ms de junho com o total de 6 pontos com isso neste perodo
pode ser que as vendas aumentem significadamente ao contrrio dos meses de
fevereiro e maro que apresentaram 0 pontos, desta forma fica mais fcil verificar as
tendncias de vendas nestes perodos, podendo realizar estratgias de marketing
que venham atrair o cliente para realizar a compra dos produtos ofertados durante
os perodos de menor fluxo de vendas.
Tabela 4: Distribuio dos feriados e fatores para cidade de Aailndia-MA.
AAILNDIA MA
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez

Confraternizao Universal (Virada de ano)

Paixo de Cristo

Pscoa
Tiradentes

1
1

Dia do trabalhador

Dia das Mes

Corpus Christi

Aaifolia

Aniversrio de Aailndia

Dia dos namorados

Expo Aai

Frias

Dia dos Pais

Independncia do Brasil

Dia das crianas

Festejo da cidade de Aailndia

Finados

Proclamao da Repblica

Natal

Total

Fonte: Autor Prprio (2010)

Aps realizar todo este processo de classificao, distribuio e totalizao


dos pontos para cada cidade das filiais, foi utilizado o software SPSS juntamente
com a tcnica estatstica de Anova (Anlise de varincia) para verificar se existem
relaes entre as vendas nos perodos de 2009 e 2010 com os feriados e fatores
socioeconmicos no mbito geral, o processo foi realizado com a exportao dos
dados do cubo OLAP destes perodos de cada uma das filiais como mostra a tabela
5 que fornece os dados da filial de Balsas-MA, a coluna perodo demonstra o

55

perodo das vendas j a coluna total de vendas em litros exibe o total de litros
vendidos de todos os produtos e a coluna peso dos feriados e fatores que fornece o
peso de cada ms com relao aos fatores e feriados.
Tabela 5: Listagem dos perodos com total de vendas e pesos de feriados e fatores da filial de
Balsas-MA.
POSTO MODELO - BALSAS-MA
Perodo
Abr-09
Mai-09
Jun-09
Jul-09
Ago-09
Set-09
Out-09
Nov-09
Dez-09
Jan-10
Fev-10
Mar-10
Abr-10
Mai-10
Jun-10
Jul-10
Ago-10
Set-10
Out-10

Total de vendas em Litros


163155
181804
192744
219248
201737
217449
214604
195305
214068
186791
200465
215813
254433
228356
225848
231388
252469
244896
254514

Peso dos feriados e fatores


3
3
6
2
0
1
1
2
1
3
1
2
3
3
6
2
0
1
1

Fonte: Autor Prprio (2010)

O mesmo processo foi realizado para a filial de Aailndia MA, como exibe
a tabela 6:
Tabela 6: Listagem dos perodos com total de vendas e pesos de feriados e fatores da filial de
Aailndia-MA.

Perodo
Abr-10
Mai-10
Jun-10
Jul-10
Ago-10
Set-10
Out-10
Nov-10
Dez-10
Jan-11

MINI POSTO PIONEIRO AAILNDIA MA


Total de vendas em Litros
Peso dos feriados e fatores
120617
3
122744
2
123754
6
132161
4
139321
1
129592
1
134095
3
117081
2
122585
1
112110
1

56

Fev-11
Mar-11
Abr-11
Mai-11
Jun-11
Jul-11
Ago-11
Set-11
Out-11

108966
127582
119593
117365
121280
133279
151423
163573
136937

0
0
3
2
6
4
1
1
3

Fonte: Autor Prprio (2010)

Com os dados organizados iniciou-se o processo de teste da tcnica de


Anova (Anlise de varincia) no software SPSS, aps a importao dos dados, o
teste foi realizado para ambas filiais, tendo como resultado final a tabela de Anova
conforme mostra a figura 37 para a filial de Aailndia MA (Mine Posto Pioneiro) e
a figura 38 para a filial de Balsas MA (Posto Modelo).

Figura 37: Teste de Anova para Aailndia-MA.


Fonte: Sada do SPSS (2010).

Pelo fato da significncia (Sig.) ser acima de 0,05 (0,399) conforme a


ilustrao na figura, verifica-se que no existe relao entre feriados de forma geral
(varivel dependente) e venda de combustveis (varivel independente) na cidade de
Aailndia - MA.

Figura 38: Teste de Anova para Balsas-MA.


Fonte: sada do SPSS (2010).

57

Pelo fato da significncia (Sig.) ser acima de 0,05 (0,703), conforme ilustra na
figura 38 verifica-se que no existe relao entre feriados de forma geral (varivel
dependente) e venda de combustveis (varivel independente) na cidade de Balsas MA. Cabe ressaltar que os resultados encontrados para a filial de Balsas,
apresentam uma distino ainda maior entre as variveis.

4. CONCLUSO
O presente trabalho ajudou a realizar um novo cenrio de tomada de decises
(BI) no Grupo de Postos de Combustveis Pioneiro, devido aplicao da
ferramenta OLAP bem como a explorao dos dados que por ventura estavam
ocultos na viso do gestor e que o sistema atual no proporcionava. Com a
montagem do cubo OLAP a facilidade de manipulao dos dados ficou de forma
intuitiva e fcil, a anlise das vendas nos perodos de 2009 e 2010 condicionou uma
comparao

com

os

feriados

fatores

socioeconmicos

gerando

acompanhamento do comportamento da empresa durante estes perodos.


A aplicao da ferramenta de BI PENTAHO juntamente com a tcnica de
estatstica Anova agregou de tal forma mais auxlio tomada de deciso e mostrou
estatisticamente que os feriados e fatores socioeconmicos em geral no
influenciam nas vendas durante o perodo analisado, alm disso o trabalho foi de
grande importncia para o gestor do Grupo de Postos de Combustveis Pioneiro,
devido a forma de visualizao dinmica que o cubo OLAP proporcionou aos dados
da sua empresa.
Levando em considerao a fundamentao terica deste trabalho e a
soluo desenvolvida, podem-se indicar as seguintes propostas para trabalhos
futuros:

Criao de um Data Mart para analisar o perfil de cada cliente;

Criar um Data Mart de feriados e fatores socioeconmicos para


posteriormente aplicar a tcnica de Data Mining;

Criar um modelo de simulao para o cubo montado.

Com o desenvolvimento das tecnologias citadas acima formar um projeto de


BI completo e moderno, fortalecendo a probabilidade de aumentar os resultados
significativos para o Grupo de Postos de Combustveis Pioneiro.

58

5. REFERNCIAS BIBLIOGRFICAS
ALVES, William Pereira. Banco de dados: teoria e desenvolvimento. 1 edio.
So Paulo: rica, 2009.

AAKER, David A; KUMMAR, V; DAY, George S; Tradutor Reynaldo Cavalheiro


Marcondes. Pesquisa de Marketing. 2 ed. 3 reimpresso. So Paulo: Atlas, 2007.

ARAJO, E. M. T. ; BATISTA, M. L. S. ; MAGALHAES, T. M. . OLAP:


Caractersticas,

Arquitetura

Ferramentas.

Jornal

Eletrnico

Cursos

Tecnolgicos do Instituo Vianna Jnior,Jornal Eletrnico Cursos Tecno, 26 out.


2007.

BARBIERI, Carlos. Bi-Business Intelligence modelagem & tecnologia, Rio de


Janeiro: Axcel Books, 2001.

BENEDITO, Miguel Furtado Junior, XML (Extensible Markup Language),


Universidade Federal do Rio de Janeiro, curso de Redes de computadores.
Disponvel

em

<http://www.gta.ufrj.br/grad/00_1/miguel/>

acesso

em:

15

de

novembro de 2010.

BISPO, Alberto Ferreira, Uma anlise da nova gerao de sistemas de apoio a


deciso, Universidade de So Carlos, dissertao de mestrado em Engenharia da
Produo. 1998.

COLAO JUNIOR, Methanias. Projetando sistemas de apoio deciso


baseados em data Warehouse. Rio de janeiro: Axcel Books, 2004

DEVMEDIA. Disponvel em:.< http://www.devmedia.com.br/articles/post-5730Introducao-ao-Analysis-Services-2005-Parte-2.html>.


novembro de 2010.

Acesso

em:

12

de

59

FELBER Edmilson J, W. Proposta de uma ferramenta olap em um data mart


comercial: uma aplicao prtica na industria caladista, Trabalho de concluso
do curso de Cincias da Computao, Centro Universitrio Feevale. Novo
Hamburgo, novembro de 2005.
FERRARI, Fabrcio Augusto. Crie banco de dados em MySQL. So Paulo: Digerati
Books, 2007.

FIGUEIREDO, Marcos Leandro; SOARES, Hlio Rubens. Comparao entre a


modelagem orientada a objeto e a modelagem estruturada relacional,
Uberlndia, ano 2005, Centro Universitrio do Tringulo UNITRI, Curso de
especializao em banco de dados.

FONSECA, Marcelo Porto Alegre. Classificao Bayesiana de grandes massas de


dados em ambientes ROLAP. Tese apresentada como requisito necessrio para
obteno do grau de doutor em Cincias em engenharia civil. COPPE/URFJ.Rio de
Janeiro, julho de 2007.

IMHOFF, Claudia; GALEMMO, Nicholas; GEIGER, J.G. Mastering data Warehouse


Design: Relational and Dimensional techniques. Indianapolis: Wiley Publishing,
INC., 2003.
INMON, W.H. Como Construir o Data Warehouse. Rio de Janeiro: Campus
1997.
KAY,

Russell.

Data

Cubes.

Computerworld

Inc.,

2005.

Disponvel

em:

<http://www.computerworld.com/datasetopics/data/story/0,10801,91640,00.htm
>. Acesso em 14 de novembro de 2010.
LINHA DE CODIGO, Disponvel em:.< http://www.linhadecodigo.com.br/artigo/
2002/Web-%E2%80%93-Uma-introdu%C3%A7%C3%A3o-ao-Desenvolvimentopar

a-a-Internet-com-Java-%E2%80%93-Parte-01-%E2%80%93-Preparando-o-

Ambient e-para-o-Desenvolvimento aspx>. Acesso em: 13 de novembro de 2010.

60

MACHADO, Felipe Nery Rodrigues. Prottipo de Data Warehouse: Uma viso


Multidimensional. So Paulo: rica, 2000.

MACHADO, Felipe Nery Rodrigues. Tecnologia e Projeto de Data Warehouse.So


Paulo, 2004.

MIRANDA, Alvira. Disponvel em:.< http://www.alvimiranda.com/2010/04/pentahoo-que-e.html>. Acesso em: 12 de novembro de 2010.


MARTINS, Daniela Siqueira, Proposta de desenvolvimento de um datamart na
rea de gesto de pessoas e aplicao de uma ferramenta olap, Trabalho de
concluso do curso de Cincias da Computao, Centro Universitrio Feevale, Novo
Hamburgo, novembro 2007.
MARTINEZ, Lus F; FERREIRA, Aristides I. Anlise de dados com SPSS
Primeiros passos.Lisboa: Escolar Editora, 2007.

MAGANHA, Fernando. Implementao de um data warehouse na secretaria de


trnsito de Guaba para anlise multidimensional de informaes.

Guaba:

ULBRA - Sistemas de Informao, 2006.

NARESH, Malhotra. Pesquisa de marketing: uma orientaao aplicada. 4 ed.


Porto Alegre: Pearson Education, 2004.
NETO, Cl_audio Manoel da Silva e Sousa, Lilian Luclia da Silva, Marcus Andre dos
Santos Semblano, Peterson Sampaio - Apresentao sobre a Ferramenta Pentaho.
Tutorial Mondrian e JPivot, Universidade federal de Minas Gerais UFMG- Cincias
da Computao- apresentado em 14 de maio de 2008.

ORACLE. Disponvel em:.< http://download.oracle.com/docs/ html/B13915_04/


i_ol ap_chapter.htm#sthref85>. Acesso em: 13 de novembro de 2010.

PENTAHO.

Disponvel

novembro de 2010.

em:.

<http://www.pentaho.org>.Acesso

em:

01

de

61

RAMAKRISHNAN, Raghu. Sistemas de banco de dados. Tradutores: Acauan


Pereira Fernandes, Celia Taniwaki, Joo Tortello, 3 edio, So Paulo: McGrawHill, 2008.

ROSA, Ktia Liane, Anlise de ferramentas Olap Open Source e freeware com
acesso banco de dados multidimensionais e relacionais, Centro Universitrio
Feevale, Trabalho de concluso do curso de Cincias da computao, Novo Hamburgo,
2004.

RODRIGUEZ, Martus V; FERRANTE, Agustin J. Tecnologia de informao e


Gesto Empresarial. Traduo: Washigton Luiz Salles e Louise Anne N. Bonitz. Rio
de Janeiro: E-Papers, 2000.

THOMSEN, E. Construindo Sistemas de Informaes Multidimensionais. 2 ed.


So Paulo: Campus, 2002.

TENORIO.

Disponvel

em:.

<www.cin.ufpe.br/~if696/seminarios/MDX.ppt>.

Acesso em 10 de novembro de 2010.

WITHEE, Ken. Microsoft Business Intelligence for Dummies. Hoboken: Wiley


Publishing, Inc. ,2010.

You might also like