Professional Documents
Culture Documents
Antnio Marinheiro
Agradecimentos
Concluir esta dissertao o culminar de um objectivo que se tornou num verdadeiro
desafio, nem sempre fcil de manter nos nveis mais elevados de disponibilidade e
motivao. Tal s foi possvel graas a um conjunto de pessoas que ao longo deste
perodo me apoiaram, aturaram e motivaram a continuar. Deixo os meus agradecimentos:
Ao Professor Doutor Jorge Bernardino que orientou, motivou e acompanhou de forma
assdua o meu trabalho, tornando possvel esta dissertao.
minha famlia por me terem dado a motivao e apoio necessrios, por terem aturado o
meu nem sempre bom humor, e as minhas ausncias em determinado perodo.
A todos os professores e colegas do Mestrado que directa ou indirectamente contriburam
para a minha formao.
administrao da empresa onde trabalho, e a todos os meus colegas, por me terem
apoiado e facultado e tudo quanto necessitei ao longo deste tempo.
Ao Eng. Mrio Leito e ao Eng. Eduardo Jesus por terem facilitado, ajudado e colaborado
no processo de implementao em ambiente real, na empresa MICROplsticos, SA.
Por fim, a todos os meus amigos que sempre me ajudaram a superar as maiores
dificuldades, prestando, como habitualmente, um apoio essencial. Thanks.
Emancipate yourselves from mental slavery; None but ourselves can free our minds.
Bob Marley, in Redemption Song
Resumo
RESUMO
Vivendo-se actualmente um ambiente de alguma instabilidade no mercado empresarial
um pouco por todo o mundo, todo o conhecimento que as empresas adquiram sobre o seu
negcio pode traduzir-se numa vantagem competitiva face concorrncia. Nestes
momentos de instabilidade necessrio actuar cuidadosamente com um maior
conhecimento, havendo uma menor margem de erro nas decises estratgicas a tomar.
Disponibilizar atempadamente o maior nmero de informaes e conhecimento, est na
base da escolha das alternativas que se levantam como suporte deciso, contribuindo
assim para um incremento do valor do negcio. Nos ltimos anos, as aplicaes
tecnolgicas em diferentes reas, especialmente de Business Intelligence (BI)
desenvolveram-se rapidamente e so consideradas como sendo das de uso mais
significativo nas tecnologias da informao. Business Intelligence uma categoria ampla
de aplicaes e tecnologias para recolha, armazenamento, anlise e disponibilizao de
acesso a dados para ajudar os utilizadores nas empresas a tomarem melhores decises de
negcio. Considerando que, no passado, o mercado de Business Intelligence foi
estritamente dominado por ferramentas comerciais, os tempos recentes foram
caracterizados pelo nascimento de solues open source. Isto representa uma enorme
vantagem competitiva, no entanto, a escolha de uma Suite open source BI um grande
desafio. O nosso trabalho contempla o estudo, avaliao e comparao das ltimas
verses das suites open source de Business Intelligence actualmente existentes. Por fim,
iremos seleccionar uma das suites, e realizar uma implementao de uma soluo de BI
numa empresa em ambiente real, provando que as suites open source BI so uma
alternativa a solues comerciais para a utilizao em PMEs. Em suma, pretendemos com
este trabalho levar o BI para as empresas, sem custo.
Resumo
ABSTRACT
Currently living an environment of some instability in the business market all over the
world, all the knowledge that companies may acquire about their own business can be
reflected as a competitive advantage against the competition. In these moments of
instability, its necessary to act cautiously with greater knowledge, once theres a lower
margin for errors in the strategic decisions to make. Timely providing the greatest amount
of information and knowledge is the basis for selecting the alternatives that arise as
decision support, thus contributing to an increase in the business value. In the latest years,
the technological applications in different fields, particularly of Business Intelligence
(BI), had a rapid development and are considered to be of the most significant use in
information technology. Business Intelligence is a broad category of applications and
technologies for gathering, storing, analysing and providing access to data to help the
users in the organizations to make better business decisions. Whereas in the past the
Business Intelligence market was strictly dominated by closed source and commercial
tools, the last few years were characterized by the appearance of open source solutions.
This represents a tremendous competitive advantage. However the choice of a suitable
open source BI suite is a challenge. The present study evaluated and compared the last
versions of the existent open source Business Intelligence suites. Finally, we will select
one of the suites and carry an implementation of a BI solution in a real business
environment, proving that open source BI suites are a viable alternative to commercial
solutions for use in SME. Resuming, with this study we intend to bring BI to the
organizations, without costs.
ii
Palavras-chave
Palavras-Chave
Open Source
Business Intelligence
Suites Business Intelligence
PME
Keywords
Open Source
Business Intelligence
Suites Business Intelligence
SME
ABREVIATURAS
AT&T - American Telephone and Telegraph
BASH - Bourne Again Shell
BDS - Berkeley Software Distribution
BI Business Intelligence
BIRT Business Intelligence and Reporting Tools
BRR - Business Readiness Rating
DBMS - Database management system
DFSG - Debian Free Software Guidelines
DSA Data Staging Area
DW Data Warehouse
ERP - Enterprise resource planning
ETL Extract, Transform, Load
FLOSS - Free/Libre as Open Source Software
FSE Fornecimentos e servios externos
FSF - Free Software Foundation
GEO Geocaching
GIS - Geographic information system
GNU - GNU is Not Unix
GPL - GNU General Public Licence
ISO - International Organization for Standardization
KPI - Key performance indicator
LDAP - Lightweight Directory Access Protocol
LGPL - GNU Lesser General Public Licence
MDX - Multidimensional Expressions
MIT - Massachusetts Institute os Technology
MP Matria prima
Multics - Multiplexed Information and Computeing
Service
ODS - Operational Data Store
OLAP - On-line Analytical Processing
OS Operating System
OSI Open Source Initiative
PA Produto acabado
PME Pequenas e Mdias Empresas
QSOS - Qualification and Selection Open Source
ROI - Return on investment
ROLAP - Relational On Line Analytical Processing
ii
Palavras-chave
Palavras-chave
iii
iv
Palavras-chave
NDICE
CAPTULO 1. INTRODUO ...................................................................................... 1
1.1. Principais contribuies deste trabalho ......................................................... 2
1.2. Estrutura do relatrio...................................................................................... 3
CAPTULO 2. SOFTWARE OPEN SOURCE ................................................................ 5
2.1. A histria do software open source ................................................................ 5
2.2. Free Software vs Open Source ...................................................................... 7
2.3. Categorias de licenas de software ................................................................ 9
2.4. O open source nas empresas ........................................................................ 10
2.5. Exemplos de software open source .............................................................. 13
CAPTULO 3. BUSINESS INTELLIGENCE .............................................................. 15
3.1. Dados vs Informao vs Conhecimento vs Deciso ................................... 16
3.2. Componentes do BI ..................................................................................... 17
3.2.1. Dados Operacionais ...................................................................... 18
3.2.2. ODS Operational Data Store ..................................................... 19
3.2.3. Ferramentas ETL .......................................................................... 19
3.2.4. Data warehouse e o modelo em estrela ........................................ 21
3.2.5. Data mining .................................................................................. 23
3.2.6. Visualizao dos resultados ......................................................... 24
3.3. Benefcios na utilizao de BI ..................................................................... 25
3.4. Dificuldades na implementao de BI ........................................................ 27
CAPTULO 4. SUITES OPEN SOURCE BI ................................................................. 29
4.1. Suites estudadas .......................................................................................... 29
4.1.1. JasperSoft ..................................................................................... 29
4.1.2. Palo ............................................................................................... 31
4.1.3. Pentaho ......................................................................................... 33
4.1.4. SpagoBI ........................................................................................ 35
4.1.5. Vanilla .......................................................................................... 37
4.2. Metodologias de avaliao .......................................................................... 39
4.2.1. Integrao ..................................................................................... 39
ii
NDICE DE FIGURAS
Figura 2.1. Logtipo da OSI............................................................................................................ 5
Figura 2.2. Logtipo do GNU ........................................................................................................ 6
Figura 2.3. Logtipo do Copyright e do Copyleft .......................................................................... 9
Figura 3.1. Dos dados deciso .................................................................................................. 17
Figura 3.2. Arquitectura tpica do BI............................................................................................ 18
Figura 3.3. Modelo em estrela .................................................................................................... 22
Figura 3.4. Processo da extraco do conhecimento ................................................................. 24
Figura 3.5. Exemplos de grficos de extraco de informao .................................................. 25
Figura 4.1. Logtipo da Jaspersoft .............................................................................................. 29
Figura 4.2. Um aspecto do iReport Designer, da suite Jaspersoft .............................................. 31
Figura 4.3. Logtipo da Palo ....................................................................................................... 31
Figura 4.4. Um aspecto da suite Palo ......................................................................................... 33
Figura 4.5. Logtipo da Pentaho ................................................................................................. 33
Figura 4.6. Um aspecto da suite Pentaho ................................................................................... 35
Figura 4.7. Logtipo da SpagoBI ................................................................................................. 36
Figura 4.8. Um aspecto da suite SpagoBI ................................................................................... 37
Figura 4.9. Logtipo da Vanilla ................................................................................................... 37
Figura 4.10. Um aspecto da suite Vanilla ................................................................................... 39
Figura 5.1. Esquema do modelo OperBRR .................................................................................. 47
Figura 6.1. Organograma da empresa ........................................................................................ 58
Figura 6.2. Viso geral do modelo dimensional ......................................................................... 63
Figura 6.3. Detalhe do modelo dimensional para a rea dos Recursos Humanos ..................... 64
Figura 6.4. Detalhe do modelo dimensional para a rea da Administrao .............................. 64
Figura 6.5. Detalhe do modelo dimensional para a rea Comercial .......................................... 65
Figura 6.6. Detalhe do modelo dimensional para a rea da Logstica ........................................ 66
Figura 7.1. SpagoBI no browser, preparado para fazer login ..................................................... 67
Figura 7.2. Modelo entidade-relacionamento no MySQL Workbench ...................................... 68
Figura 7.3. Data warehouse gerada atravs do MySQL Workbench .......................................... 69
Figura 7.4. Ligaes e querys no repositrio do Talend ............................................................. 70
Figura 7.5. Configurao da ligao base de dados operacional, Oracle ................................ 71
Figura 7.6. Job principal no Talend, contendo a sequncia de execuo dos sub-jobs ............. 72
iii
iv
NDICE DE TABELAS
Tabela 2.1 Exemplos de software open souce em diversos domnios .................................... 13
Tabela 4.1 Comparao das suites open source BI ................................................................. 41
Tabela 5.1 Categorias da metodologia OpenBRR .................................................................... 45
Tabela 5.2 Mtricas para cada categoria da metodologia OpenBRR ...................................... 47
Tabela 5.3 Peso das diversas categorias escolhidas ................................................................ 51
Tabela 5.4 Peso das capacidades da categoria funcionalidades ............................................. 52
Tabela 5.5 Avaliao das funcionalidades das suites .............................................................. 52
Tabela 5.6 Avaliao da categoria Usabilidade ....................................................................... 53
Tabela 5.7 Avaliao da categoria Qualidade .......................................................................... 54
Tabela 5.8 Avaliao da categoria Documentao .................................................................. 54
Tabela 5.9 Avaliao da categoria Comunidade ...................................................................... 55
Tabela 5.10 Avaliao da categoria Segurana ....................................................................... 55
Tabela 5.11 Avaliao da categoria Arquitectura .................................................................... 56
Tabela 5.12 Nota ponderada das suites em avaliao ............................................................ 56
vi
CAPTULO 1
1. INTRODUO
No ambiente empresarial actual, em virtude das grandes alteraes que se tm verificado,
as organizaes necessitam ser suficientemente geis para antecipar as mudanas,
encontrando solues e adaptando-se, ou criando condies para serem mais competitivas
relativamente concorrncia.
Neste contexto, h cada vez mais a necessidade das organizaes terem informaes
relevantes que auxiliem no suporte de decises estratgicas e de ferramentas para servir
esses propsitos. Desde os primrdios da estratgia organizacional, na A Arte da Guerra,
escrito h cerca de 2500 anos por Sun Tzu (Tzu, 2011), que existe uma preocupao na
forma de se conhecerem os pontos fortes e fracos das organizaes, assim como os dos
concorrentes. Mais recentemente, Michael Porter refere que em qualquer empresa a
informao tecnolgica tem um efeito poderoso na vantagem competitiva em termos de
custos e diferenciao (Porter et al., 1985). Antes da tratamento informtico da
informao, no sendo esta estruturada, as decises tomadas tinham sempre um grande
grau de intuio. Com a complexidade tecnolgica e concorrencial dos dias de hoje, as
empresas esto obrigadas a prestar uma ateno redobrada ao processo de controlo
interno, de desempenho e aos sistemas de suporte deciso. Neste mbito, (Williams et
al., 2003) afirma que a engenharia de processos e a anlise da mudana estabelecem as
bases para incrementar o valor do negcio.
As pequenas e mdias empresas (PME), representam mais de 98% das empresas de todo
o mundo (Global Alliance of SMEs, 2010). No entanto a sua capacidade financeira
normalmente reduzida, o que limita muitas vezes o acesso a sistemas que ajudem na
tomada de deciso, bem como o prprio acompanhamento do seu negcio, o que se no
for feito adequadamente conduz a uma perda da competitividade da empesa, ou at sua
runa.
Nos ltimos anos, as aplicaes tecnolgicas em diferentes reas, especialmente de
Business Intelligence (BI) desenvolveram-se rapidamente e so consideradas como sendo
das de uso mais significativo nas tecnologias da informao. O Business Intelligence
pode ser definido como sendo uma categoria ampla de aplicaes e tecnologias para
recolha, armazenamento, anlise e disponibilizao de acesso a dados para ajudar os
utilizadores nas empresas a tomarem as melhores decises de negcio (Negash et al.,
2003).
Considerando que, no passado, o mercado de Business Intelligence foi estritamente
dominado por ferramentas comerciais, os tempos recentes foram caracterizados pelo
nascimento de solues open source. Isto representa uma enorme vantagem competitiva,
no entanto, a escolha de uma suite open source BI um grande desafio.
O open source comea hoje a ser visto com outros olhos por parte das empresas,
oferecendo cada vez mais garantias e disponibilizando ptimas solues para o ambiente
empresarial, contribuindo para uma grande reduo dos custos a nvel tecnolgico.
CAPTULO 1
O problema principal que este trabalho pretende resolver levar o Business Intelligence
para as empresas, sem custos.
O foco deste trabalho assim a seleco e implementao de uma suite open source de
Business Intelligence, numa empresa de mdia dimenso, tentando demonstrar que estas
solues so viveis neste tipo de empresas, pois no existem custos de aquisio, embora
requeiram algum esforo e investimento na sua implementao.
So estas, de uma forma geral, as principais contribuies que foram dadas com o
desenvolvimento deste trabalho.
De salientar tambm que foram publicados dois artigos em conferncias internacionais
com processo de seleco pelos pares:
Analysis of Open Source Business Intelligence Suites, CISTI2013, Antnio
Marinheiro e Jorge Bernardino
OpenBRR Evaluation of an Open Source BI Suite, C3S2E13, Antnio
Marinheiro e Jorge Bernardino
CAPTULO 1
CAPTULO 2
CAPTULO 2
CAPTULO 2
Em 1969 a AT&T retira-se do projecto por prever que este demoraria bastante tempo e
levaria a custos altssimos. Os programadores Ken Thompson e Dennis Ritchie juntam-se
assim a outros membros e decidem criar uma verso simplificada do Multics, a que em
forma de stira vm a atribuir o nome de Unics (Uniplexed Information and Computing
Service), mais tarde mudado para Unix.
Na dcada seguinte Thompson e Ritchie publicam um artigo sobre o Unix, incentivando a
cpia do seu sistema por parte das universidades. Visto no ser a informtica o foco da
AT&T, decidiram fornec-lo sem restries, incentivando o seu uso, estudo e
reestruturao. Iniciam-se assim os encontros para discutir o Unix, compartilhando o
cdigo fonte e os estudos para a sua melhoria, o que deu origem a que surgissem desde
logo vrias verses do sistema.
Em 1984 a AT&T, j aps o TCP/IP se ter tornado um padro da Internet, dividida em
vrias companhias, criando uma sucursal para a informtica, o que levou a que o Unix
deixasse de ser uma plataforma partilhada. Nesta altura j eram comuns os computadores
pessoais com sistemas operativos proprietrios.
Ainda em 1984 Richard Stallman inicia o projecto GNU (acrnimo recursivo de GNU is
Not Unix) por achar que a comunidade de programadores que trabalhavam em conjunto
tinha sido praticamente extinta com o desaparecimento dos softwares open source. A sua
ideia foi ento criar um sistema operativo em que qualquer pessoa tenha privilgios e o
possa usar, copiar, alterar e distribuir, juntando novamente uma comunidade de
programadores. A figura 2.2. ilustra o logtipo adoptado para identificar o GNU.
CAPTULO 2
Em 1985 ele cria ento a FSF (Free Software Foundation) (FSF, 2014) a fim de
desenvolver e manter o sistema GNU, cujo financiamento resultava da venda de CDs de
software livre. Foi desenvolvido ento o interpretador de comandos BASH (Bourne
Again Shell), cujo nome uma aluso a Stephen Bourne, criador do Shell do Unix. A
FSF paralelamente ao desenvolvimento do sistema GNU possibilita ainda aperfeioar
diversos programas que podiam ser executados em sistemas Unix proprietrios. S no
incio da dcada seguinte o sistema GNU dado como praticamente pronto, faltando
desenvolver o seu kernel (ncleo), que possibilitaria a comunicao hardware/software.
Em 1991, Linus Torvalds, ento estudante da Universidade de Helsnquia, na Finlndia,
desenvolve um kernel compatvel com o Unix utilizando o gcc, baseado num sistema
operativo desenvolvido para fins educacionais chamado Minix, que tomou o nome de
Linux. Linus decidiu publicar na Internet o cdigo do seu kernel para que este fosse
estudado e aperfeioado por uma comunidade mais vasta. Em 1992 o kernel Linux foi
integrado no GNU completando assim este sistema, que se passou a chamar GNU/Linux,
actualmente apenas conhecido como Linux.
Ainda nesta dcada h um marco que define aqueles que so os princpios do open
source. Eric Raymond com a publicao do artigo A Catedral e o Bazar (Raymond,
1997) influencia a Netscape a disponibilizar o acesso ao cdigo-fonte do seu navegador,
hoje conhecido como Firefox. Raymond, a Netscape e outras empresas e programadores
comeam ento a procurar formas para atrair para os princpios do open source empresas
que desenvolvem software do tipo comercial.
A publicao de Raymond, que foi apresentada no Linux Kongress (realizado a 27 de
Maio de 1997 em Wurzburg, na Alemanha), considerada como sendo o manifesto do
movimento open source, onde inspirado por Linus Torvals, consagrou a frase Havendo
olhos suficientes, todos os erros so bvios (Raymond, 1997).
CAPTULO 2
qualquer lugar. O ser livre segundo Stallman significa que ningum tem que pedir
permisso ou pagar pela permisso, desde que esteja na posse do software.
Para que a liberdade de realizar modificaes e de publicar verses alteradas tenha
significado, deve ter-se acesso ao cdigo-fonte do software, sendo esta uma condio
necessria para que o software seja livre.
No entanto Stallman foi sempre uma pessoa tida como tendo um discurso muito
politizado e de alguma forma radical, nomeadamente na condenao do software
proprietrio.
Eric Raymond, fazendo parte de uma nova gerao de programadores, e no concordando
essencialmente com o discurso de Stallman, criticou-o abertamente na publicao j
referida A Catedral e o Bazar (Raymond, 1997), em que considera o modelo de
desenvolvimento GNU como se fossem catedrais, monumentos slidos, desenvolvidos a
partir de um grande planeamento. J o modelo adoptado por Linus Torvals comparado a
um bazar, com uma dinmica bastante descentralizada. As alteraes do software so
rapidamente distribudas pela comunidade, que analisa e avalia, sendo que as melhorias
so rapidamente adoptadas e as falhas so tambm rapidamente identificadas.
Stallman tenta at hoje deixar claro que o free de free software no significa grtis mas
livre. Esta confuso tornou-se assim na justificao que faltava para uma rotura com a
FSF (Free Software Foundation).
Assim, em 1998, Eric Raymond junto com outras personalidades fundou a Open Source
Initiative (OSI), que adoptou o termo open source para se referir ao software livre, com
uma postura mais pragmtica relativamente adopo de software de cdigo aberto como
uma soluo vivel, e menos ideolgica que a da Free Software Foundation.
As quatro liberdades idealizadas por Stallman so aceites como recomendaes prticas.
Porm, para que uma licena de software seja considerada de cdigo aberto pela OSI,
deve atender aos dez critrios da Definio de Cdigo Aberto (OSI, 2014), que inclui a
livre redistribuio, permisso de trabalhos derivados, no descriminao e distribuio
da licena entre outros.
As diferenas de princpio entre os dois movimentos no so muito substanciais, sendo-o
mais ideologicamente. Os defensores do open source dizem que o termo que adoptaram
fez com que os empresrios percebessem que o software livre tambm pode ser
comercializado.
Sobre o assunto, na Wikipdia pode mesmo ler-se que para o movimento do software
livre, que um movimento social, no tico aprisionar conhecimento cientfico, que
deve estar sempre disponvel, para assim permitir a evoluo da humanidade (Software
Livre, 2014). J o movimento pelo open source, defende que o software desse tipo traz
CAPTULO 2
diversas vantagens tcnicas e econmicas. O open source surgiu para levar as empresas a
adoptarem o modelo de desenvolvimento de software livre.
Uma vez que as diferenas so essencialmente ideolgicas, as duas correntes unem-se em
diversas situaes, ou so mencionadas pela sigla FLOSS (Free/Libre Open Source
Software).
CAPTULO 2
ela protegido, como impede que este seja integrado em software proprietrio
(GPL, 2014).
CAPTULO 2
O crescimento do software open source nos ltimos anos vem abrir uma nova janela de
oportunidade para empresas, instituies, utilizadores e fornecedores de hardware e
software.
Embora ainda seja encarado por muitos como uma moda passageira que se esvanecer
a mais ou a menos curto prazo (Baptista et al., 2004), deve ser hoje encarado como uma
opo credvel, criadora de oportunidades de elevado potencial, que dever ser levada em
conta por qualquer decisor ou tcnico envolvido de alguma forma com as tecnologias de
informao.
A Unio Europeia tem nos ltimos anos sido uma das principais dinamizadoras da
adopo de software open source nas suas instituies e tambm entre os estados
membros (Portugal e a realidade europeia, 2012). Em Portugal, esta adopo tem sido
lenta, mas as empresas comeam a aderir a esta oferta.
Uma aposta cada vez maior das universidades no desenvolvimento de software open
source tem levado a uma procura maior por parte das empresas para este tipo de software
para diversas solues como software de escritrio, servidores aplicacionais, servidores
de email, bases de dados, aplicaes de gesto de contedos, aplicaes de gesto de
clientes, etc (Oliveira, 2012).
Uma pesquisa realizada em 2010 pela empresa Zenoss (Watters, 2010) e apresentada
numa conferncia sobre administrao de sistemas numa comunidade open source,
indicava que 98% das empresas usam de alguma forma algum tipo de software open
source. necessrio levar em conta a comunidade em que esta pesquisa foi realizada, mas
tal estudo reflecte algo que inegvel. Neste estudo a flexibilidade e os baixos custos
foram apontados como o principal factor de escolha de open source, j por outro lado a
fraca documentao e a falta de apoio so a sua principal recusa na adopo.
Na Unio Europeia, empresas como a Airbus, a EDF ou o Deutsche Bank so exemplos
de grandes empresas que aderiram ao open source, tal como em Portugal a Zon, a
Sonaecom, a Sumol+Compal, a Ordem dos Advogados ou a Egor (Casos de sucesso,
2014).
A nvel de instituies estatais tal medida implicaria uma grande reduo de custos, e um
exemplo a ser seguido o do Brasil, em que desde h vrios anos vrios sectores do
Estado utilizam software livre, e estabeleceram o seu uso como objectivo estratgico para
todo o governo (Kuhn, 2005). Na Europa, tambm a Rssia assinou um plano para alterar
o software das autoridades federais para software livre at ao final de 2014 (Carlos,
2011).
Tais medidas no significam tomar partido pelo software livre ou pelo software
proprietrio de um ponto de vista fundamentalista, como se um fosse o bom e o outro
11
CAPTULO 2
fosse o mau. No entanto estes podem e devem coabitar no melhor interesse das pessoas,
empresas e instituies envolvidas.
Um grande factor contra o software proprietrio a total obscuridade em termos de
garantias de cdigo e a dependncia dos fornecedores para actualizaes, suporte, e claro,
o custo das licenas. Esta uma das grandes vantagens do open source, a que levou alis
a Rssia a tomar a deciso j referida. No apenas a questo econmica que est em
causa, embora tenha um grande peso, mas acima de tudo a segurana que a
independncia relativamente a fornecedores propcia.
Mas nem tudo no open source so vantagens, h pontos que no so to vantajosos na
adopo destas solues. Como principais vantagens para o open source podem-se referir
(Sinfic, 2008):
As actualizaes permanentes.
12
CAPTULO 2
Inexistncia de uma verso estvel do produto, pois este est sempre em evoluo.
Na seco seguinte iremos dar alguns exemplos de programas de software open source
utilizados em diversos domnios.
Soluo
Modelao de dados
Antivrus e manuteno
Partilha de ficheiros
Desenvolvimento
Editores de Imagem
Modeladores 3D
Editores de Som e Imagem
Editores de Texto e HTML
Emuladores
Gestores de Download
Mensagens instantneas
Jogos
Navegador, E-mail e Calendrio
Utilitrios
Office
Software Cientfico
Gesto de Documentos
ClamWin, MemTest
Shareaza, Freenet, Azureus, BitTorrent, eMule, LimeWire,
Ares, Deluge
Euphoria, Code::Blocks, Dev-C++, Dev Pascal, Eclipse, Free
Pascal, Icon, Lazarus, Lua, MinGW, Netbeans, Perl, Python,
Quincy, Ruby, Ruby on Rails, Sharp Develop, Unicon, CARealia, qt
Paint.NET, Inkscape, Gimp
Blender, Wings 3D
Aimp2, Audacity, Virtualdubmod, MPlayer, Media player
classic, VLC, Songbird, Miro, Lmms
AbiWord, LibreOffice, Nvu, LaTeX, Scribus, Notepad++, Vim,
Emacs
Stella, O2EM, MEKA, Gens, ZSNES, Finalburn Alpha,
Project64, Visual Boy Advance, Nintendo DS
Free Download Manager, TrueDownloader, Orbit,
Millweed, Tor
Pidgin, aMSN, Miranda IM, Mercury IM
FreeCol, LGames, SpaceShooter, Frets on Fire, Battle for
Wesnoth, UFO Alien Invasion, Quake 1, 2 e 3
Google Chrome, Mozilla Firefox, Mozilla Thunderbird,
Mozilla Sunbird, K-Meleon, SeaMonkey
1-4a Rename, 7-zip, Filzip, Vorbis, wxMusik, Filezilla
OpenOffice, LibreOffice, Crimson Editor, DeskLight
SciLab, Octave, Maxima, FreeMat, JMathLib
GED Maarch
13
CAPTULO 2
Pode ser encontrada informao permanente sobre este tipo de produtos em diversos
repositrios online, de onde se destacam:
Neste captulo fizemos um resumo da histria do open source, vimos a diferena entre
free software e open source, abordmos os principais tipos de licenas, enquadrmos o
open source na realizade das empresas e fornecemos alguns exemplos de software open
source em diversos domnios. No captulo seguinte iremos abordar o Business
Intelligence.
14
CAPTULO 3
3. BUSINESS INTELLIGENCE
Business Intelligence (BI) um termo proposto e promovido por Howard Dresner da
Gartner Group em 1989. Ele descreve-o como um conjunto de conceitos e mtodos para
melhorar a tomada de deciso empresarial recorrendo a sistemas de apoio baseados em
factos (Power, 2007).
Na altura, a indstria de software falava em acrnimos como Sistemas de Apoio
Deciso e Sistemas de Informao Executiva, e Howard Dresner procurava um conceito
que elevasse o debate a outro patamar. Este explica que no tinha inteno de colocar o
foco do lado tecnolgico apenas mas principalmente do lado do negcio.
O Business Intelligence surge assim como um conjunto de conceitos e mtodos para
auxiliar e aumentar a capacidade de tomada de deciso nas organizaes, transformando
os seus dados em conhecimento (Negash, 2004).
J para (Sezes et al., 2006), o BI um conceito que engloba um vasto conjunto de
aplicaes de apoio tomada de deciso que possibilitam um acesso rpido, partilhado e
interactivo da informao, bem com a sua anlise e manipulao; atravs destas
ferramentas, os utilizadores podem descobrir relaes e tendncias e transformar grandes
quantidades de informao em conhecimento til.
Em (Sezes et al., 2006) pode ler-se ainda que os sistemas de BI tm em comum o
seguinte conjunto de objectivos fundamentais:
15
CAPTULO 3
As empresas devem conhecer os seus pontos fortes e fracos, e tambm conhecerem os dos
seus concorrentes, e terem facilmente acesso e actualizao desta informao, traduz-se
em vantagem competitiva para o prprio negcio.
Com a exigncia e complexidade tecnolgica e concorrencial dos dias de hoje, as
empresas esto obrigadas assim a prestar uma ateno redobrada ao processo de controlo
interno, de desempenho e aos sistemas de suporte deciso.
16
CAPTULO 3
3.2. Componentes do BI
Os componentes do BI consistem em ferramentas que realizam em conjunto o trabalho de
armazenamento de dados, anlise de informao e prospeco de dados (data mining),
como se pode verificar na ilustrao da figura 3.2.
17
CAPTULO 3
18
CAPTULO 3
19
CAPTULO 3
O ETL normalmente considerado uma das etapas mais crticas duma data warehouse,
uma vez que envolve a movimentao de dados. A origem dos dados pode ser diversa,
desde diferentes bases de dados, a ficheiros de texto, ou outras.
A extraco a recolha de dados dos sistemas de origem, os dados operacionais,
extraindo-os e passando-os para o ambiente da data warehouse. O ETL pode ser realizado
de forma independente dos sistemas operacionais.
A transformao realiza a limpeza, os ajustes e a consolidao, permitindo melhorar a
qualidade dos dados e consolid-los das diversas origens. Nesta fase aplicam-se uma srie
de regras ou funes aos dados a serem carregados. Sobre algumas origens pode no ser
necessria grande manipulao de dados, j noutras os dados necessitam ser trabalhados
para um correcto carregamento. A transformao pode passar por exemplo por
seleccionar apenas algumas colunas a carregar, ou traduzir dados para uma linguagem
uniforme da data warehouse (por exemplo, relativamente ao campo sexo, numa origem
feminino pode ser 0, noutra 1, ou F, e na DW ter sido adoptado Feminino).
O carregamento consiste em passar os dados j transformados para o modelo dimensional
da DW. Este passo varia consoante as necessidades das organizaes, ou das opes de
projecto seguidas. Podem ter intervalos de carregamento definidos, actualizar dados
acumulados ou acrescentar dados nas dimenses.
Todo este processo ocorre numa rea da data warehouse designada por DSA (Data
Staging Area), que uma rea de armazenamento, fora dos limites dos utilizadores finais,
e que no fornece servios de pesquisa nem de apresentao de dados.
A gesto de um sistema ETL, exige algumas tarefas especficas de carregamento de
dados, planos de backup, verificao da segurana, etc.
Antes de se iniciar um projecto de ETL, necessrio levar em conta alguns requisitos,
como (Ribeiro, 2011):
Viabilidade dos dados foi realizada alguma anlise da viabilidade dos dados?
Latncia dos dados qual o tempo mximo permitido para disponibilizao dos
dados no sistema de BI?
O ETL assim um dos processos do ciclo de vida da data warehouse, sendo considerado
um dos mais crticos e morosos, onde normalmente despendido entre 55% e 80% do
esforo de todo o processo de implementao (Inmon, 1997; Demarest, 1997).
20
CAPTULO 3
21
CAPTULO 3
22
CAPTULO 3
Neste modelo, h tantas dimenses quantas as vertentes sob as quais se pretende analisar
os factos. Como as tabelas de dimenso tm poucos registos (comparativamente com a
tabela de factos), so tabelas com muitos atributos (fortemente desnormalizadas), para
evitar mais junes mas que contm os descritores do negcio de forma a permitirem
realizar os agrupamentos de pesquisas necessrios. Isto , como j referido, as pesquisas
so realizadas mais rapidamente pois existem menos junes (join) que so operaes
muito dispendiosas do ponto de vista de processamento.
Para elaborar o modelo dimensional, devem ser seguidos quatro passos:
1. Identificar o processo de negcio e modelizar compreender os requisitos do
negcio conjuntamente com os dados disponveis.
2. Definir a granularidade do processo de negcio especificar o nvel de detalhe
que a tabela de factos representa.
3. Escolher as dimenses para cada tabela de factos representam todas as
descries possveis que tomam os valores nicos no contexto de cada medio.
4. Identificar os factos numricos de cada tabela de factos respondem ao que
estamos a medir, dentro da granularidade definida.
Nesta seco abordmos o modelo em estrela numa data warehouse. Na seco seguinte
abordaremos outro componente do BI, o data mining.
CAPTULO 3
24
CAPTULO 3
CAPTULO 3
Quanto aos benefcios, tomando por base um projecto implementado com sucesso,
descrito em (Primak, 2008) so referidos:
26
Vantagem competitiva.
CAPTULO 3
CAPTULO 3
Neste captulo abordmos o Business Intelligence quanto sua necessidade por parte das
empresas, quais os seus componentes, os seus benefcios e a dificuldade da sua
implementao.
No captulo seguinte abordaremos as suites open source de Business Intelligence.
28
CAPTULO 4
4.1.1. JasperSoft
A Jaspersoft afirma-se como fornecendo uma modalidade de self-service medida das
necessidades individuais das empresas (Jaspersoft, 2014). A sua suite Jaspersoft foi criada
em 2006, depois de vrios anos a empresa ter criado as diversas ferramentas
individualmente. A Jaspersoft afirma que fornece o conjunto de BI mais flexvel,
econmico e amplamente implementado no mundo. No seu site, pode ler-se que j foi
realizado o download de mais de 14 milhes de cpias do software de cdigo aberto em
todo o mundo, 175.000 implementaes de produo e que tm mais de 14.000 clientes
em 100 pases. Afirmam ainda que a suite regularmente actualizada por uma
comunidade de desenvolvimento de mais de 225.000 membros registados. A figura 4.1
representa o logtipo da suite Jaspersoft.
29
CAPTULO 4
30
CAPTULO 4
4.1.2. Palo
Palo como designada a suite open source desenvolvida desde 2007 pela empresa
alem Jedox AG (Palo, 2014). Esta empresa desenvolve ainda uma verso comercial, com
o nome Jedox, que tem normalmente um avano no cdigo desenvolvido entre 12 a 15
meses, relativamente Palo. A plataforma completamente baseada em cdigo open
source, totalmente gratuita e distribuda sob uma licena GNU GPL (v2), sendo o seu
logtipo o que se encontra ilustrado na figura 4.3.
CAPTULO 4
Manager); ETL (ETL Server). ainda composta pelos produtos Palo OLAP, Palo for
Excel, Palo Web e Palo ETL.
O Palo OLAP um servidor multidimensional OLAP, que trabalha em memria, estando
os dados organizados em cubos, dimenses e elementos. Esta estrutura reflecte a forma
como usualmente os utilizadores pensam o seu negcio. O facto de trabalhar em memria
traduz-se numa vantagem relativamente a outros sistemas OLAP com suporte a uma base
de dados relacional, que segundo os responsveis chega a ser 100 vezes mais rpido,
permitindo disponibilizar dados em tempo real.
O Palo for Excel um add-in para o Excel e Open Office, que agregado ao OLAP Server
Database constitui uma soluo completa de BI. Permite integrar no Excel as dimenses
relevantes da organizao disponibilizadas pelo Palo, permitindo a sua visualizao e
anlise simultaneamente.
O Palo Web combina todos os componentes do Palo, que permite criar anlises,
planeamento ou relatrios, numa plataforma uniforme Web. Integra o Palo Spreadsheet,
o Palo Pivot (realizao de pivot tables ad-hoc), o Palo User Manager para gesto de
acessos a utilizadores ou grupos, o Palo ETL Manager que cria e controla os projectos de
integrao de dados e, o Palo File Manager que disponibiliza a cada utilizador ou
aplicao espao para armazenamento de ficheiros, facilitando a integrao e
colaborao.
O Palo ETL permite realizar a integrao, atravs de ETL, de grandes quantidades de
dados a partir de origens heterogneas. Baseado em ambiente Web, permite facilmente a
converso de um modelo relacional para um modelo OLAP, e realiza o armazenamento
em memria necessrio para o Drill-through (ligao entre origens de dados), que exibe
detalhadamente atravs de navegao. A verso mais recente do Palo a 3.2, de Julho de
2011, mostrando a figura 4.4. um aspecto das opes da suite.
32
CAPTULO 4
4.1.3. Pentaho
A Pentaho foi fundada em 2004 por um grupo de executivos com grande experincia em
BI oriundos de empresas como a Business Objects, Cognos, Hiperion, JBoss, Oracle, Rad
Hat e SAS (Pentaho, 2014). A suite Pentaho actualmente das mais usadas e das que
maior reputao tem no mercado (Schlegel et al., 2013). A figura 4.5. ilustra o logtipo da
Pentaho.
CAPTULO 4
34
CAPTULO 4
4.1.4. SpagoBI
O SpagoBI um software para desenvolvimento de projectos de BI em ambientes
integrados (SpagoBI, 2014). suportado pela empresa Engineering (Engineering, 2014)
que, de acordo com o seu site, no tem interesse na sua explorao comercial, pois uma
empresa de consultadoria. Para desenvolver a ferramenta a empresa criou a SpagoWorld
Initiative em 2006, que mantm a ferramenta com uma comunidade open source,
actualmente sob uma licena GNU Lesser General Public Licence (LGPL). S h uma
verso do SpagoBI, gratuita e completa, ao contrrio de outras suites que tm verses
community, com funcionalidades reduzidas, e verses enterprise, com as
funcionalidades necessrias a uma total integrao numa organizao. Toda a
escalabilidade necessria numa organizao suportada pelo SpagoBI, a nvel de
arquitectura, funcionalidades e segurana. O seu logtipo est mostrado na figura 4.7.
35
CAPTULO 4
36
CAPTULO 4
4.1.5. Vanilla
Vanilla uma suite BI open source suportada pelo consrcio francs BPM-Conseil, com a
primeira verso a ser lanada em Junho de 2008 (Vanilla, 2014). Fundada em 2004, a
BPM-Conseil possui vasta experincia em consultadoria, e com a sua equipa de
programadores iniciou o desenvolvimento do Vanilla em 2007. Mais que uma agregao
de ferramentas, o Vanilla uma plataforma que permite definir a sequncia completa do
negcio graas grande diversidade de componentes que possui. Sendo uma suite
disponibilizada integralmente em open source, distribuda sob uma licena MPL
(Mozilla Public Licence), e desenvolvida em linguagem Java, sendo o seu logtipo o
ilustrado na figura 4.9.
CAPTULO 4
BI integrado no portal Vanilla, os mdulos Web para utilizadores finais e tambm alguns
mdulos para Web designers. FreeMetadata, Vanilla plugins for BIRT, Free Dashboards,
FreeWebReport, Analysis Schema Designer, BiGateway para ETL, BiWorkflow e
BiProcessManager so as outras components da suite.
Entre as suas principais caractersticas podemos destacar a integrao segura de
metadados com o BIRT com optimizaes SQL, bem como com o FreeDashboards e
Cubes. Permite ainda integrao com ETL e Workflow. Possui uma base de dados de
indicadores de desempenho (KPIs), totalmente integrveis com outros mdulos como o
BiGateway ou Dashboard. Possibilita ainda realizar todas as etapas padro de ETL, com
suporte a SQL, OLAP, FreeMetrics e origens de dados FreeMetada.
O suporte para SaaS (Software as a Service) permite hospedar diferentes projectos num
nico servidor, disponibilizando ainda multi-repositrios. A arquitectura de cluster
suportada pelo mdulo Hypervision, e permite gerir clusters de diferentes servios
Vanilla (ETL, relatrios, etc.).
A suite bastante completa e robusta, com a vantagem de ser totalmente open source, e
entre as diversas funcionalidades que disponibiliza ainda se destaca o suporte a Workflow
BPMN 2.0 integrado para desenho de processos de negcio complexos, bem como
inmeros recursos de BI como colunas dinmicas, origens alternativas de dados,
validao de polticas de segurana e clculos personalizveis no FreeMetadata.
Suporta ainda a gesto integrada de documentos, e permite a integrao completa de
mdulos e documentos: Metadata, Dashboard, Report, Cubes, KPI, Workflow e ETL. A
verso mais recente do Vanilla a 4.4.2, lanada em Dezembro de 2013, ilustrando a
figura 4.10 um aspecto desta mesma suite.
38
CAPTULO 4
4.2.1. Integrao
CAPTULO 4
4.2.3. Anlise
40
OLAP Permite que os utilizadores finais analisem dados com pesquisas bastante
rpidas e desempenho de clculo, navegando facilmente em pesquisas
multidimensionais. Nalguns casos permite o write-back de valores para bases de
dados proprietrias para planeamento e modelao. Pode abranger uma variedade
de arquitectura de dados (relacional, multidimensional) e de armazenamento
(disco ou memria).
CAPTULO 4
Vanilla
SpagoBI
Pentaho
Palo
Funcionalidades
JasperSoft
Suites
ETL
Colaborao
Reporting
Dashboards
Pesquisas ad-hoc
Integrao com Office
BI Mvel
OLAP
Visualizao interactiva
Data mining
Scorecards
41
CAPTULO 4
Desta anlise, podemos destacar como a melhor ferramenta do estudo a SpagoBI, que
suporta todas as capacidades por ns seleccionadas, sendo que das suites estudadas, , a
par com a Vanilla, uma suite que possui uma nica verso, totalmente open source e
gratuita. A SpagoBI disponibiliza ainda outras capacidades alm das avaliadas neste
estudo, como por exemplo Localizao Inteligente (GEO-GIS) ou Master Data
Management (para usufruto das capacidades write-back na base de dados) e rivaliza
mesmo com a maior parte das verses comerciais das outras suites em estudo.
A Pentaho surge como a segunda ferramenta na nossa anlise, visto que suportando
basicamente as mesmas capacidades da SpagoBI, possui uma verso comercial, o que
consideramos uma desvantagem. no entanto, das estudadas, a suite eventualmente mais
usada, como referido por (Schlegel et al., 2013). Oferece, junto com a SpagoBI uma
soluo completa que permite atingir os objectivos duma implementao BI numa
empresa, em busca dum maior conhecimento do negcio e duma vantagem competitiva.
Contudo do estudo efectuado, concluimos que a suite no permite que os utilizadores
partilhem e discutam a informao disponibilizada, com chat e notas, e que a possam
integrar noutras ferramentas colaborativas.
O facto de no suportar uma integrao com Office (Microsoft, OpenOffice, LibreOffice
ou outros) traduz-se numa desvantagem para a Vanilla, que, sendo das suites menos
conhecidas, mas que nas restantes funcionalidades rivaliza tanto com a SpagoBI como
com a Pentaho. junto com estas uma boa soluo de implementao de BI.
J a Palo e a JasperSoft, podemos considerar que esto num nvel inferior s suites j
referidas. O facto de no suportarem data mining nem scorecards deixa-as em grande
desvantagem relativamente concorrncia, pois negligenciam nas verses open source
capacidades fundamentais nas implementaes de BI, apostando essencialmente nas
verses comerciais, nas quais disponibilizam outro tipo de capacidades. O facto da Palo
no disponibilizar uma verso desde Julho de 2011 coloca-a, no nosso entender, para a
ltima posio deste estudo, pois no disponibiliza solues de mobilidade, to usadas
actualmente, e que so uma tendncia do mercado a par com a anlise Big Data (no
levado em conta neste trabalho). A JasperSoft peca essencialmente pela discrepncia de
oferta da verso open source relativamente s suas verses comerciais, que so trs,
apostando visivelmente mais nessa vertente. No entanto, relativamente s capacidades
disponibilizadas na verso Community, estas so robustas e competitivas com as
restantes.
Resumindo, neste captulo, descrevemos e analismos as suites open source escolhidas, e
comparmo-las pelas suas funcionalidades. Da comparao escolhemos as duas
ferramentas que mais funcionalidades e potencialidades ofereciam e que iro ser alvo de
avaliao experimental. Foram estas as suites Pentaho e SpagoBI.
42
CAPTULO 4
43
CAPTULO 5
44
CAPTULO 5
5. AVALIAO EXPERIMENTAL
Aps realizar a anlise das ferramentas baseado na informao disponibilizada por cada
fornecedor, neste captulo ir ser feita a anlise prtica das duas ferramentas que mais se
destacaram nesse estudo: SpagoBI e Pentaho.
A anlise ser efectuada sobre duas perspectivas, a da avaliao do software open source
em si, e das funcionalidades do BI, que sero as j referidas na seco anterior e baseadas
nos critrios da Gartner.
Com vista a garantir a qualidade, surgiram diversas metodologias de avaliao de
software open source nos ltimos anos, que devem ser levadas em conta antes de se tomar
a deciso de adopo de um destes tipos de software por parte das organizaes. Duas
destas metodologias que se destacam so a Qualification and Selection Open Source
(QSOS, 2013) apoiado pela Atos Origin (Atos, 2013) e a Business Readiness Rating
(OpenBRR, 2013) criada pelo Carnegie Mellon Silicon Valley Center for Open Source
Investigation (CMU, 2013) e Intel (Intel, 2013). Ambas as metodologias de avaliao
ajudam os utilizadores a alcanar um objectivo semelhante, que seleccionar entre uma
lista de projectos semelhantes o mais adequado ao seu contexto.
Em (Deprez et al., 2008) so descritas as vantagens e desvantagens de cada uma das
metodologias, sendo referido que a OpenBRR permite seleccionar os critrios para os
adaptar a um contexto, e que a QSOS ambgua em mais de metade dos seus critrios.
Esta anlise levou-nos a optar pela adopo da metodologia OpenBRR para avaliar as
suites open source BI.
5.1. OpenBRR
A metodologia OpenBRR assenta em 12 categorias que esto descritas na tabela 5.1.
Tabela 5.1 Categorias da metodologia OpenBRR
Categoria
Funcionalidade
Descrio
O software atende s exigncias do utilizador mdio?
Usabilidade
Qualidade
Segurana
Desempenho
Escalabilidade
Arquitectura
Apoio
45
CAPTULO 5
Documentao
Adopo
Comunidade
Profissionalismo
Neste modelo, a classificao das categorias pode ter diferentes nveis de importncia
dependendo dos requisitos para utilizao do software. A implementao do mtodo
divide-se em quatro fases.
1. Numa primeira fase deste mtodo, deve-se identificar a lista de componentes do
software a ser analisada, medir cada componente em relao aos critrios de
avaliao, e remover da anlise qualquer componente do software que no
satisfaa os requisitos de uso.
2. Na segunda fase, deve-se atribuir pesos s categorias e s mtricas do seguinte
modo:
Classificar as 12 categorias de acordo com a importncia (1 a mais alta, 12
a menor).
Seleccionar as 7 categorias mais altas (ou menos), e atribuir uma percentagem
de importncia para cada uma, totalizando 100%.
Para cada mtrica dentro de uma categoria, classificar a mtrica de acordo com
a importncia.
Para cada mtrica dentro de uma categoria, atribuir a importncia percentual,
totalizando todas as mtricas 100% da categoria.
3. Na terceira fase, deve-se recolher a informao para cada mtrica utilizada em
cada categoria, e atribuir uma ponderao, num nvel de 1 (inaceitvel) a 5
(excelente).
4. Por fim, na quarta fase, deve-se utilizar a qualificao da categoria e os factores de
ponderao para calcular a pontuao final.
A figura 5.1. abaixo mostra de uma forma geral o funcionamento do mtodo.
46
CAPTULO 5
Mtrica
Descrio
Usabilidade
Qualidade
47
CAPTULO 5
comerciais
N de point/patch releases nos
ltimos 12 meses
Segurana
Desempenho
Escalabilidade
Nmero de vulnerabilidades de
segurana nos ltimos seis meses
que so moderadas a extremamente
crticas
Nmero de vulnerabilidades de
segurana ainda em aberto (sem
correco)
H testes de desempenho e
relatrios de referncia (Benchmark)
disponveis?
Optimizao de desempenho e
configurao
Referncia de implementao
P1 bug um bug de prioridade 1 que normalmente significa que sem a sua resoluo a aplicao no
pode continuar
48
CAPTULO 5
H plug-ins de terceiros?
Contribuio do utilizador
Adopo
A disponibilidade de livros
certamente bom. Uma forma
padronizada de contagem dos
livros disponveis importante
Mede o quanto o software
escalvel e testado em ambiente
real, atravs de implementao no
mundo real
Comunidade
Os contribuintes de cdigo
normalmente promovem a
construo de uma comunidade
volta do projecto. Quanto maior o
nmero de contribuintes de cdigo,
melhor o apoio da comunidade
Apoio
Documentao
49
CAPTULO 5
5.2. Avaliao
O mtodo Open BRR, estabelece que se devem escolher, no mximo, as 7 categorias mais
relevantes para a anlise, de forma a evitar que as mais importantes tenham a sua
importncia diluda pelas menos relevantes. Aps esta escolha, deve ento atribuir-se-lhes
o peso para a avaliao final.
A tabela 5.3 mostra a escolha feita para esta avaliao, tendo em conta os interesses da
implementao.
50
CAPTULO 5
Peso
Funcionalidade
40%
Usabilidade
15%
Qualidade
15%
Documentao
10%
Comunidade
10%
Segurana
Arquitectura
5%
5%
51
CAPTULO 5
Peso
ETL
Colaborao
3
2
Reporting
Dashboards
Pesquisas ad-hoc
3
2
BI Mvel
OLAP
Visualizao interactiva
3
1
Data mining
Scorecards
1
2
Pela importncia para a empresa, na utilizao final, foi atribudo o maior peso (3) ao
ETL, Reporting, Dashboards e OLAP, importncia intermdia (2) Colaborao,
Pesquisas ad-hoc, Integrao com Office, BI Mvel e Scorecards, e menor importncia
(1) Visualizao interactiva e ao Data mining.
A avaliao das funcionalidades das suites, apresentada na tabela 5.5 abaixo.
Tabela 5.5 Avaliao das funcionalidades das suites
Funcionalidades esperadas
Peso
Classificao
Pentaho
SpagoBI
ETL
Colaborao
Reporting
2
3
2
3
2
3
Dashboards
Pesquisas ad-hoc
3
2
3
2
3
2
2
2
0
2
2
2
OLAP
Visualizao interactiva
Data mining
3
1
1
3
1
1
3
1
1
Scorecards
Funcionalidades Extra
Georreferenciao
Totais
2
26
0
22
2
26
CAPTULO 5
Peso
Usabilidade
15%
Mtrica
Peso
Nota Ponderada
50%
Pentaho
5
SpagoBI
5
Pentaho
2,5
SpagoBI
2,5
25%
1,25
1,25
25%
1,25
1,25
Em todas as mtricas foi dada nota mxima a ambas as suites, pois em ambas a
experincia de utilizao excelente, e o tempo de instalao dos pr-requisitos e da
prpria suite menor do que 10 minutos. A nota de ambas as suites na categoria
usabilidade foi de 5 pontos, nos 5 possveis.
Na tabela 5.7 podemos observar a avaliao para a categoria Qualidade.
53
CAPTULO 5
Peso
Qualidade
15%
Mtrica
Peso
SpagoBI
3,4
Nota Ponderada
20%
Pentaho
3
SpagoBI
5
Pentaho
0,6
SpagoBI
1
20%
0,2
0,6
10%
0,3
0,4
10%
0,4
0,2
20%
0,2
0,2
20%
0,2
Nesta categoria encontrmos para cada mtrica resultados bem distintos entre as suites,
em que, por exemplo, a Pentaho lanou uma verso da suite e a SpagoBI lanou duas,
tento a Pentaho uma nota pior, como pode ser consultado nos anexos. No total da
categoria a Pentaho teve uma nota de 1.9 e a SpagoBI teve uma nota de 3.4 em 5 pontos
possveis, oferecendo a SpagoBI maior qualidade segundo estes critrios.
Na tabela 5.8 podemos observar a avaliao para a categoria Documentao.
Tabela 5.8 Avaliao da categoria Documentao
Categoria
Peso
Documentao
10%
Nota sem peso
Pentaho SpagoBI
SpagoBI
5
Mtrica
Peso
Nota Ponderada
Pentaho SpagoBI
50%
2,5
2,5
Contribuio do utilizador
50%
2,5
2,5
54
CAPTULO 5
Peso
Comunidade
10%
Mtrica
Peso
60%
Pentaho
3
40%
SpagoBI
3,8
Nota Ponderada
SpagoBI
3
Pentaho
1,8
SpagoBI
1,8
Nesta categoria, ambas esto dentro dos mesmos intervalos de avaliao das mtricas,
pelo que obtiveram a mesma nota final de 3.8 pontos em 5.
Na tabela 5.10 podemos observar a avaliao para a categoria Segurana.
Tabela 5.10 Avaliao da categoria Segurana
Categoria
Peso
Segurana
5%
Mtrica
Peso
Nota Ponderada
Nmero de vulnerabilidades de
segurana nos ltimos seis meses que
so moderadamente a extremamente
crticas
Nmero de vulnerabilidades de
segurana ainda em abertos (sem
correco)
40%
Pentaho
5
SpagoBI
5
Pentaho
2
SpagoBI
2
40%
20%
55
CAPTULO 5
Peso
Arquitectura
5%
Mtrica
Peso
H plug-ins de terceiros?
50%
Pentaho
5
50%
SpagoBI
3
Nota Ponderada
SpagoBI
1
Pentaho
2,5
SpagoBI
0,5
2,5
2,5
Peso
Nota Ponderada
Pentaho
SpagoBI
Funcionalidade
40%
1,2
Usabilidade
Qualidade
15%
15%
0,75
0,285
0,75
0,51
Documentao
Comunidade
10%
10%
0,5
0,38
0,5
0,38
Segurana
5%
0,25
0,25
Arquitectura
5%
0,25
3,615
0,15
4,54
Aplicando o mtodo Open BRR, com a escolha das categorias mais relevantes tendo em
conta a implementao real e as necessidades da empresa, e distribudos os pesos tendo
em conta o mesmo interesse, a SpagoBI atinge a nota mais alta entre as duas suites.
No critrio do mtodo Open BRR, a nota de 4,54 Muito Bom, o que oferece toda a
confiana para ser esta a suite escolhida para prosseguir o trabalho.
A aplicao deste mtodo mostrou-se til nesta avaliao, pois oferece um critrio de
avaliao objectivo, reproduzvel e auditvel, atribuindo um valor numrico que permite
uma comparao com outras avaliaes de outros produtos.
Assim, ser a SpagoBI que ser utilizada na implementao em ambiente real na empresa.
Em resumo, neste captulo descrevemos a metodologia de avaliao e avalimos as duas
suites que escolhemos anteriormente, a SpagoBI e a Pentaho. Desta avaliao resultou a
suite com que faremos a implementao.
No captulo seguinte, faremos a anlise ao modelo de dados da data warehouse, tendo em
vista a implementao que responder s necessidades da empresa.
56
CAPTULO 6
6. MODELO DE DADOS
Neste captulo ser descrita a empresa MICROplsticos, SA, onde ser realizada a
implementao da suite SpagoBI, e analisaremos as necessidades a que teremos que dar
resposta. Ser tambm definido o modelo dimensional que servir para construir a data
warehouse que suportar a implementao.
6.1. A empresa
A MICROplsticos, S.A., sediada na Figueira da Foz, iniciou a sua actividade em 1987 e
uma empresa que desenvolve uma actividade industrial de fabrico de peas plsticas de
alta preciso e de componentes funcionais para a indstria elctrica, electrnica, de
consumo e automvel.
A actividade principal a injeco de peas em plstico - transformao de matrias
plsticas para produo de componentes industriais. Emprega, em mdia, cerca de 230
trabalhadores e tem influncia directa sobre o emprego de mais 150 trabalhadores ligados
a pequenas empresas locais prestadoras de servios. No produz directamente para venda
ao consumidor final. Os clientes so pertencentes a grupos transnacionais e fornecedores
de grandes indstrias. O volume de negcio anual foi de 27 milhes de euros (Dirio
Coimbra, 2014) para o ano de 2012.
A produo est centrada em quatro indstrias produtos de consumo, elctrica,
electrnica e automvel, sendo que esta ltima a que tem mais peso. No entanto, a
MICROplsticos no est refm de nenhuma das actividades deste sector, nem esta
predominncia determina qualquer perda de competitividade para responder a solicitaes
de outros clusters, distribuindo as vendas por vrias reas dentro da indstria automvel
(v.g. segurana, electrnica, interiores).
uma empresa predominantemente exportadora. O destino maioritrio das suas vendas
o mercado espanhol, em consonncia com a prtica da economia nacional, pois Espanha
tem um posicionamento bastante forte na indstria automvel, ocupando o terceiro lugar
como produtora de veculos e componentes e uma referncia neste cluster em termos de
economia global.
MICROplsticos detentora de certificao dos Sistemas de Gesto Ambiental (ISO
14000), do Sistema de Gesto de Segurana e Medicina (OSHAS 18001/NP 4397), do
Sistema da Qualidade (NP EN ISO 9001:2000 e ISO/TS 16949:2002).
O processo de fabrico tem como principal ferramenta o molde, construdo em ao, que
possui cavidades com a forma da pea a produzir. Cada molde serve apenas para produzir
uma pea ou conjunto de peas e propriedade do cliente, pois a pea plstica que da
resulta exclusiva. A matria-prima plstico que tem um aspecto granulado. Durante o
processo de produo sofre um aquecimento (processo de estufagem) entrada na
57
CAPTULO 6
mquina de injeco para o derreter e depois injectada no molde onde adquire a forma
a desenhada.
A figura 6.1. mostra o organograma da empresa.
58
CAPTULO 6
6.2.2. Administrao
A Administrao elegeu como principais questes a serem respondidas as seguintes:
Gastos com Pessoal/ Vendas
Margem bruta4 das vendas de Produto Acabado (PA)
Margem bruta Total
Margem bruta dos Moldes
Peso dos consumos5 sobre as vendas
Distribuio dos consumos por tipo (MP Plst, Comp Plst, Comp. Diversos,
Embalagem)
Distribuio dos FSE6
Subcontratao - Injeco
Subcontratao - Montagem
VAB7/ N colaboradores
VAB/ Gastos com pessoal
6.2.3. Comercial
O departamento Comercial pretende obter resposta para as seguintes questes:
Vendas por tipo de operao (Injeco; Injeco + Montagem; Montagem)
Vendas de Produto Acabado (PA)
Vendas de PA - real vs objectivo
Vendas de PA - por cliente
Vendas de PA - por mercado geogrfico
Vendas de PA - por indstria
2
VAB - Valor acrescentado bruto = Vendas Custo mercadorias vendidas (61) Gastos com pessoal (63)
59
CAPTULO 6
Vendas de projectos
Vendas de projectos - por cliente
Vendas de projectos - por mercado geogrfico
Vendas de projectos - por indstria
6.2.4. Logstica
A logstica elegeu como questes a ver respondidas as seguintes:
Variao da produo8
Cobertura de stocks9 Produto Acabado (PA)
Cobertura de stocks Matria Prima (MP)
Transportes especiais/ Venda de produtos
Transportes especiais
Transportes por tipo
Absentismo factos referentes ao absentismo. Por data, por funcionrio, por rea
funcional, por turno e por tipo de falta, d-nos o n de horas e de minutos das
faltas.
Stock no fim do ms, multiplicado por 30, sobre as vendas do ms (sempre em valor)
60
CAPTULO 6
A incluso das chaves forasteiras por rea funcional e por turno nestas duas tabelas,
justificam-se pelo facto de ocasionalmente haver rotatividade de funcionrios entre reas
funcionais e turnos.
Na rea de Administrao, temos apenas a tabela de factos:
Contabilidade factos referentes aos movimentos contabilsticos. Por data e por
conta do SNC (sistema de normalizao contabilstica), d-nos informao sobre
os valores a dbito, a crdito e saldo (dbito menos crdito) de determinada conta
do SNC.
Na rea Comercial, temos a tabela de factos:
Vendas factos relativos a vendas. Por data, por cliente/fornecedor e por produto,
d-nos se foi uma venda de injeco e/ou montagem, a sua quantidade e valor.
Utiliza-se cliente/fornecedor em vez de apenas cliente, uma vez que determinadas
entidades so em simultneo uma coisa e outra, isto , uma entidade pode fornecer
matria-prima e comprar peas.
Por fim, na rea de Logstica, temos as tabelas de factos:
Stock factos relativos a stock de produtos. Por data, por produto e por armazm,
d-nos a quantidade, o preo unitrio e valor do stock.
Transportes factos relativos a transportes. Por data, por transportadora, por tipo,
e por natureza, d-nos informao se foi transporte normal ou especial, se foi de
produto acabado ou matria-prima, interno ou externo, se foi subcontratao, se
foi da categoria diversos, e qual foi o seu valor de custo.
61
CAPTULO 6
Na figura 6.2 podemos observar uma viso genrica do modelo dimensional. Podemos
observar que existem quatro reas de interveno identificadas, num modelo em estrela,
com a granularidade a ser definida pela tabela Data, comum a todas as tabelas de
factos. Nas figuras seguintes, 6.3 a 6.6, podemos observar detalhes do modelo, por rea
de actuao.
62
CAPTULO 6
63
CAPTULO 6
Figura 6.3. Detalhe do modelo dimensional para a rea dos Recursos Humanos
Com o detalhe da figura 6.3 conseguimos responder a todas as questes que o
departamento dos Recursos Humanos pretende.
Na figura 6.4, podemos observar um detalhe do modelo dimensional para a rea da
Administrao.
64
CAPTULO 6
A figura 6.4 mostra a tabela de factos Contabilidade que tem como dimenses a tabela
SNC e Data, que define a granularidade, e responde a todas as questes que a
Administrao pretende, baseado no modelo em rvore do SNC.
Na figura 6.5, podemos observar um detalhe do modelo dimensional para a rea
Comercial.
65
CAPTULO 6
66
CAPTULO 7
7. IMPLEMENTAO
Neste captulo abordaremos a implementao da suite open source SpagoBI em ambiente
industrial real. Tendo a suite escolhida e definido o modelo dimensional, vamos descrever
neste captulo a implementao.
Na MICROplsticos privilegia-se o software open source, pelo que vrios servios esto
assentes em sistemas operativos Linux.
Tendo em conta este facto, optou-se por preparar uma mquina Linux virtualizada que
facilmente se colocou a funcionar no ambiente real, integrada na restante infra-estrutura
da empresa. Optou-se pelo OpenSuse (OpenSuse, 2014) por ser tambm este j usado e
conhecido na empresa.
H muitas distribuies j com pr-instalao de diversas ferramentas disponveis para
download na Internet. No caso, optou-se por fazer download duma imagem virtualizada,
preparada para o VMWare (VMWare, 2014), no site do Traffic Tool (Traffictool, 2014),
pronta para ser executada atravs do VMWare Player (Player, 2014).
CAPTULO 7
7.2. MySQL
Para carregar os dados para a data warehouse o motor de base de dados escolhido foi o
MySQL, por ser suportado pela SpagoBI, por ser gratuito e um dos mais utilizados em
todo o mundo, e tambm porque um dos motores de base de dados usados na empresa.
Seguindo o modelo de dados definido, usou-se o MySQL Workbench para desenhar o
modelo entidade-relacionamento, como pode ser observado na figura 7.2.
68
CAPTULO 7
7.3. Talend
A SpagoBI suporta automatizao de ETL a partir da ferramenta Talend (Talend, 2014),
que instalmos e usmos para para realizar o mesmo.
Esta ferramenta suportada por vrias suites, e pela experincia que tivemos pode-se
afirmar que simples e intuitiva, e com um ptimo suporte de documentao online
(TalendDocs, 2014).
A base de dados operacional na empresa assenta sobre um motor Oracle. Assim e visto
que para os vrios jobs necessitaramos de introduzir componentes de consulta base de
dados operacional, e de consulta e escrita data warehouse, optmos por criar as ligaes
s bases de dados no repositrio da ferramenta, no caso em Metadata (Metadata, 2014).
As querys de consulta tambm foram a guardadas, sendo mais fcil de gerir e propagar
quaisquer alteraes para os diversos jobs onde estejam a ser usadas, como podemos
observar na figura 7.4.
69
CAPTULO 7
70
CAPTULO 7
71
CAPTULO 7
Figura 7.6. Job principal no Talend, contendo a sequncia de execuo dos sub-jobs
Vamos explicar o processo de ETL para a tabela de factos Absentismo, que podemos
observar na figura 7.7.
72
CAPTULO 7
73
CAPTULO 7
74
CAPTULO 7
75
CAPTULO 7
76
CAPTULO 7
77
CAPTULO 7
78
CAPTULO 7
CAPTULO 7
Wikimedia Commons (Wikimedia, 2014), em que cada forma geomtrica vectorial tem
um identificador que deve estar relacionado com a nossa origem de dados, como pode ser
observado na figura 7.19.
80
CAPTULO 7
81
CAPTULO 7
82
CAPTULO 7
que os custos com pessoal relativamente s vendas variam entre os 12 e os 16%, com
excepo dos meses em que h lugar a pagamento de subsdios, e do ms de Agosto em
que a empresa fecha temporariamente para frias e os custos com pessoal tm um peso
maior. Olhando para o grfico e numa anlise muito superficial, percebe-se que no h
desiquilbios, o que indica que uma empresa estvel, e de boa sade.
7.5. Acessos
As configuraes de regras, autenticao e acessos aos diversos documentos foram
realizadas para os diversos utilizadores que tm acesso a este tipo de informao, atravs
do menu de gesto que pode ser observado na figura 7.23.
83
CAPTULO 7
7.6. Automatizao
Para automatizar o carregamento do ETL foi tambm criado um documento do tipo ETL
Process, com recurso ao Talend Engine, como mostra a figura 7.24, e que foi
agendado para uma execuo diria.
84
CAPTULO 8
85
CAPTULO 8
86
CAPTULO 8
87
CAPTULO 8
88
REFERNCIAS
REFERNCIAS
Amaral, L., Varajo, J., Planeamento de Sistemas de Informao - 4 Edio Actualizada
e Aumentada, FCA Editora de Informtica, 2007, pp. 6-9
Antonelli, R., Conhecendo o Business Intelligence, CAP Accounting and Management,
Revista Cientfica do TECAP, N3, Ano 3, Vol. 3, 2009, pp. 79-85
Atos, http://atos.net/en-us/home.html
Baptista, et al., Open Source Software Que oportunidades em Portugal, APDSI Associao para a Promoo e Desenvolvimento da Sociedade de Informao, 2004
BSD, http://www.linfo.org/bsdlicense.html [acedido em Dezembro, 2013]
Carlos, B., Russia ir mudar para open source at ao final de 2014, PortalOpenSource,
2011, http://www.portalopensource.com/2011/01/17/russia-ira-mudar-para-opensource-ate-ao-final-de-2014/
Casos de sucesso, http://www.esop.pt/casos-de-sucesso/ [acedido em Dezembro, 2013]
Categories of free and nonfree software, 2002,
http://www.gnu.org/philosophy/categories.en.html [acedido em Dezembro, 2013]
CMU, http://www.cmu.edu/silicon-valley/ [acedido em Dezembro, 2013]
Davenport, T.; Prusak, L. Conhecimento empresarial. Rio de Janeiro: Campus, 1998
Debian, http://www.debian.org/social_contract [acedido em Dezembro, 2013]
Demarest, M., The politics of data warehousing, 1997
Deprez, J., Alexandre, S., Comparing Assessment Methodologies for Free/Open Source
Software: OpenBRR & QSOS, CETIC, Charleroi, Belgium, 2008
Dirio Coimbra, http://issuu.com/diariodecoimbra/docs/1000_maiores_2013 [acedido em
Dezembro, 2013]
Eclipse, https://www.eclipse.org/ [acedido em Dezembro, 2013]
89
REFERNCIAS
90
REFERNCIAS
REFERNCIAS
92
REFERNCIAS
Sezes, C., Oliveira, J., Baptista, M., Business Intelligence, SPI Sociedade
Portuguesa de Inovao, 2006,
http://www.bi4all.pt/docs/Manual_Business_Intelligence.pdf [acedido em Dezembro,
2013]
Shareware, http://www.techterms.com/definition/shareware [acedido em Dezembro,
2013]
Sinfic, O Que Uma Soluo Open Source?, Sinfic, SA, 2008
Software Livre, http://pt.wikipedia.org/wiki/Software_livre [acedido em Dezembro,
2013]
Software semi-livre, https://www.gnu.org/philosophy/categories.en.html [acedido em
Dezembro, 2013]
SpagoBI, http://www.spagoworld.org/xwiki/bin/view/SpagoBI/Vision [acedido em
Dezembro, 2013]
Stallman, R., The GNU Project, Open Sources, 1998
Talend, http://www.talend.com/ [acedido em Dezembro, 2013]
TalendDocs,
https://help.talend.com/display/TALENDOPENSTUDIOFORDATAINTEGRATIONUS
ERGUIDE52EN/Home [acedido em Dezembro, 2013]
Traffictool, http://www.traffictool.net/vmware/opensuse123.html [acedido em Dezembro,
2013]
Tzu, S., A Arte da Guerra, Texto Editores, Julho 2011
Vanilla, http://www.bpm-conseil.com/ [acedido em Dezembro, 2013]
VMWare, http://www.vmware.com/ [acedido em Dezembro, 2013]
Watters, A., Survey Finds Enterprise Is Overwhelmingly Open Source, Readwrite,
2010, http://readwrite.com/2010/08/10/survey-finds-enterprise-isove#awesm=~opFm40zJGJECsE [acedido em Dezembro, 2013]
93
REFERNCIAS
Wikimedia,
http://commons.wikimedia.org/wiki/Category:Blank_SVG_maps_of_the_world [acedido
em Dezembro, 2013]
WikiStudio, https://wiki.spagobi.org/xwiki/bin/view/spagobi_studio/ [acedido em
Dezembro, 2013]
Williams S., Williams N., The Business Value of Business Intelligence, Business
Intelligence Journal, Fall 2003
X.org, http://www.x.org/wiki/ [acedido em Dezembro, 2013]
94
ANEXO A
Usabilidade
Experincia do interface para o utilizador final
Descrio
Avaliao
5 - Excelente
Simples e
intuitivo,
informao est
bem organizada,
no necessrio
manual
Pentaho
SpagoBI
4 - Bom
3 Aceitvel
Leva algum
tempo a
aprender,
informao
pouco
organizada,
algum uso do
manual
2 - Pobre
1 Inaceitvel
Informao
complexa, sem
organizao
lgica, no pode
ser usado sem
manual
X
X
Tempo/esforo necessrio para levantar o sistema, com todos os prrequisitos instalados. No inclui o sistema operativo
5 - Excelente
< 10 minutos
X
4 - Bom
10 - 30 minutos
3 - Aceitvel
30 min - 1 hora
2 - Pobre
1 - 4 horas
1 Inaceitvel
> 4 horas
Avaliao
Pentaho
SpagoBI
4 - Bom
10 - 30 minutos
3 - Aceitvel
30 min - 1 hora
2 - Pobre
1 - 4 horas
1 Inaceitvel
> 4 horas
95
ANEXO A
Qualidade
N de minor releases nos ltimos 12 meses
Descrio
Avaliao
Pentaho
SpagoBI
4 - Bom
3 - Aceitvel
1 ou 3
X
2 - Pobre
1 Inaceitvel
0 ou >3
4 - Bom
Pentaho
SpagoBI
3 - Aceitvel
1-2 ou 5-6
2 - Pobre
1 Inaceitvel
0 ou >6
X
4 - Bom
50 - 100
3 - Aceitvel
100 - 500
X
2 - Pobre
500 - 1000
1 Inaceitvel
> 1000
96
ANEXO A
Pentaho
SpagoBI
4 - Bom
60% - 75%
X
3 - Aceitvel
45% - 60%
2 - Pobre
25% - 45%
1 Inaceitvel
< 25%
http://jira.pentaho.com/issues/?jql=project%20%3D%20BISERVER%20AND%20issue
type%20%3D%20Bug%20AND%20status%20in%20(Resolved%2C%20Closed)%20A
ND%20created%20%3E%3D%202012-1207%20AND%20created%20%3C%3D%202013-05-07
Resultado: 286 -> 71%
http://www.spagoworld.org/jira/issues/?jql=project%20%3D%20SPAGOBI%20AND%
20issuetype%20%3D%20Bug%20AND%20status%20in%20(Resolved%2C%20Closed
)%20AND%20created%20%3E%3D%202012-1207%20AND%20created%20%3C%3D%202013-05-07
Resultado: 15 -> 30%
4 - Bom
1-5
3 - Aceitvel
5 -10
2 Pobre
10 - 20
Pentaho
SpagoBI
1 Inaceitvel
> 20
X
X
http://jira.pentaho.com/issues/?jql=project%20%3D%20BISERVER%20AND%20issue
type%20%3D%20Bug%20AND%20created%20%3E%3D%202012-1207%20AND%20created%20%3C%3D%202013-0507%20AND%20priority%20in%20(Blocker%2C%20Critical%2C%20Severe)
Resultado: 304
http://www.spagoworld.org/jira/issues/?jql=project%20%3D%20SPAGOBI%20AND%
20issuetype%20%3D%20Bug%20AND%20priority%20in%20(Blocker%2C%20Critic
al%2C%20Major)%20AND%20created%20%3E%3D%202012-1207%20AND%20created%20%3C%3D%202013-0507%20ORDER%20BY%20priority%20DESC
Resultado 36
4 - Bom
3 - Aceitvel
2 Pobre
1 Inaceitvel
97
ANEXO A
<1 semana
Pentaho
SpagoBI
1 - 2 semanas
2 - 3 semanas
3 - 4 semanas
> 4 semanas
X
http://jira.pentaho.com/issues/?jql=project%20%3D%20BISERVER%20AND%20issue
type%20%3D%20Bug%20AND%20status%20in%20(Resolved%2C%20Closed)%20A
ND%20created%20%3E%3D%202012-1207%20AND%20created%20%3C%3D%202013-0507%20AND%20priority%20in%20(Blocker%2C%20Critical%2C%20Severe)%20OR
DER%20BY%20remainingEstimate%20ASC%2C%20due%20ASC
Resultado: 34 dias
http://www.spagoworld.org/jira/issues/?jql=project%20%3D%20SPAGOBI%20AND%
20issuetype%20%3D%20Bug%20AND%20priority%20in%20(Blocker%2C%20Critic
al%2C%20Major)%20AND%20status%20in%20(Resolved%2C%20Closed)%20AND
%20created%20%3E%3D%202012-1207%20AND%20created%20%3C%3D%202013-0507%20ORDER%20BY%20priority%20DESC
Resultado: 1,8 dias
Segurana
Nmero de vulnerabilidades de segurana nos ltimos seis
meses que so moderadamente a extremamente crticas
Descrio
Avaliao
Pentaho
SpagoBI
4 - Bom
1-2
3 Aceitvel
34
2 Pobre
5-6
1 Inaceitvel
>6
http://jira.pentaho.com/issues/?jql=project%20%3D%20BISERVER%20AND%20issue
type%20in%20standardIssueTypes()%20AND%20priority%20in%20(Blocker%2C%20
Critical%2C%20Severe%2C%20Medium)%20AND%20created%20%3E%3D%20201
2-12-07%20AND%20created%20%3C%3D%202013-0507%20AND%20text%20~%20security%20ORDER%20BY%20issuetype%20DESC%2
C%20resolution%20ASC%2C%20remainingEstimate%20ASC%2C%20due%20ASC
Resultado: 0
http://www.spagoworld.org/jira/issues/?jql=project%20%3D%20SPAGOBI%20AND%
20issuetype%20in%20standardIssueTypes()%20AND%20priority%20in%20(Blocker%
2C%20Critical%2C%20Major)%20AND%20status%20in%20(Resolved%2C%20Close
d)%20AND%20created%20%3E%3D%202012-12-
98
ANEXO A
07%20AND%20created%20%3C%3D%202013-0507%20AND%20text%20~%20security%20ORDER%20BY%20priority%20DESC
Resultado: 0
4 - Bom
1
3 Aceitvel
2
2 Pobre
3-5
1 Inaceitvel
>5
4 - Bom
3 - Aceitvel
Sim
2 Pobre
1 Inaceitvel
No
http://wiki.pentaho.com/display/ServerDoc2x/Security
http://wiki.spagobi.org/xwiki/bin/view/spagobi_server/User+Management_v3
Desempenho
H testes de desempenho
(Benchmark) disponveis?
Descrio
Avaliao
relatrios
de
referncia
4 - Bom
3 - Aceitvel
Sim
2 Pobre
1 Inaceitvel
No
X
Pentaho
SpagoBI
4 - Bom
3 - Aceitvel
Sim, alguma
2 Pobre
1 Inaceitvel
No
99
ANEXO A
Pentaho
SpagoBI
http://wiki.pentaho.com/display/EAI/Performance+tuning
Escalabilidade
Referncia de implementao
Descrio
Avaliao
5 Excelente
Sim, com
publicao do n
de utilizadores
X
Pentaho
SpagoBI
4 - Bom
3 - Aceitvel
Sim
2 Pobre
1 Inaceitvel
No
Avaliao
Pentaho
SpagoBI
4 Bom
3 - Aceitvel
Sim, alguma
2 Pobre
1 Inaceitvel
No
Arquitectura
H plug-ins de terceiros?
Descrio
Avaliao
Pentaho
SpagoBI
4 Bom
6 - 10
3 - Aceitvel
2-5
2 Pobre
1
1 Inaceitvel
0
X
100
4 Bom
3 - Aceitvel
Sim
2 Pobre
1 Inaceitvel
No
ANEXO A
Apoio
Volume mdio de listas de discusso gerais nos ltimos 6
meses
Descrio
Avaliao
4 Bom
300 - 720 msg
por ms
3 - Aceitvel
150 - 300 msg
por ms
2 Pobre
30 - 150 msg
por ms
1 Inaceitvel
< 30 msg por
ms
Pentaho
SpagoBI
Pentaho
SpagoBI
4 Bom
3 - Aceitvel
Apenas apoio
instalao
2 Pobre
1 Inaceitvel
Sem apoio
profissional
Documentao
Existncia de vrios tipos de documentao
Descrio
Avaliao
5 Excelente
Instalar /
implementar,
utilizadores,
administrao,
optimizao,
actualizao,
documentao
de
desenvolvimento
est disponvel
em multiplos
formatos (pdf,
html)
X
Pentaho
SpagoBI
4 Bom
Instalar /
implementar,
utilizadores,
administrao,
manuais de
melhoramento
disponveis em
vrios formatos
3 - Aceitvel
Instalar /
implementar e
manual de
utilizador
disponvel
2 Pobre
Apenas existe
documentao
de instalao
baseada em
texto
1 Inaceitvel
Sem
documentao.
Um ficheiro
README no
conta
101
ANEXO A
Contribuio do utilizador
Descrio
Avaliao
Pentaho
SpagoBI
4 Bom
3 - Aceitvel
As pessoas
podem
contribuir
2 Pobre
1 Inaceitvel
Utilizadores no
podem
contribuir
Adopo
Quantos ttulos de livros na Amazon.com devolve a consulta:
subject:computer and title:component name"
Descrio
Avaliao
Pentaho
SpagoBI
4 Bom
6 - 15
X
3 - Aceitvel
3-6
2 Pobre
1-3
1 Inaceitvel
0
Referncia de implementao
Descrio
Avaliao
5 Excelente
Sim, com
publicao do n
de utilizadores
X
Pentaho
SpagoBI
4 Bom
3 - Aceitvel
Sim
2 Pobre
1 Inaceitvel
No
Comunidade
Volume mdio de listas de discusso geral nos ltimos 6
meses
Descrio
Avaliao
102
4 Bom
3 - Aceitvel
2 Pobre
1 Inaceitvel
ANEXO A
> 720
mensagens por
ms
30 - 150 msg
por ms
Pentaho
SpagoBI
Avaliao
Pentaho
SpagoBI
4 Bom
20 - 50
3 - Aceitvel
10 - 20
2 Pobre
5 - 10
1 Inaceitvel
<5
Em ambos os casos, nos ltimos 6 meses no foi possvel analisar, esta indicao pela
lista de contribuintes de cdigo disponibilizada pelas plataformas
Profissionalismo
Driver do projecto
Descrio
Avaliao
5 Excelente
Fundao
independente
apoiada por
corporaes
(estilo Apache /
OSDL)
4 Bom
Corporativo
(estilo MySQL)
3 - Aceitvel
2 Pobre
Grupos
1 Inaceitvel
Individuais
Pentaho
SpagoBI
Avaliao
5 Excelente
S depois de ser
um contribuidor
activo externo
por algum
tempo
Pentaho
SpagoBI
4 Bom
3 - Aceitvel
Bastante difcil,
deve contribuir
com correces
aceites por
algum tempo
X
2 Pobre
1 Inaceitvel
Qualquer um
pode entrar
103
ANEXO A
104
ANEXO B
105
ANEXO B
106
ANEXO B
ANEXO B
108
ANEXO C
Anexo C
Artigo Analysis of Open Source Business Intelligence Suites
8 Conferncia Ibrica de Sistemas e Tecnologias de Informao - CISTI'2013
19-22 de Junho de 2013, Lisboa - Portugal
109
ANEXO C
Jorge Bernardino
110
I.
Introduo
ANEXO C
111
ANEXO C
JasperSoft
112
ANEXO C
Palo
113
ANEXO C
Pentaho
desenhar relatrios com suporte por wizard, multilngua, filtros de visualizao interactiva, e
exportao para os formatos mais comuns.
114
ANEXO C
D.
SpagoBI
Vanilla
115
ANEXO C
116
III.
Metodologia de avaliao
B.
Integrao
Disponibilidade da Informao
ANEXO C
Anlise
IV.
Capacidades
Vanilla
SpagoBI
Pentaho
C.
Palo
JasperSoft
ETL
Colaborao
117
ANEXO C
Reporting
Dashboards
Pesquisas ad-hoc
Integrao com Office
Mobilidade BI
OLAP
Visualizao interactiva
Data Mining
Scorecards
118
V.
ANEXO C
Referncias
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
[10]
[11]
[12]
[13]
[14]
[15]
[16]
[17]
[18]
[19]
[20]
[21]
119
ANEXO D
Anexo D
Artigo OpenBRR Evaluation of an Open Source BI Suite
C3S2E 2013 - Sixth International C* Conference on Computer Science & Software Engineering
10-12 de Julho de 2013, Porto - Portugal
120
ANEXO D
jorge@isec.pt
a21200015@alunos.isec.pt
ABSTRACT
Business Intelligence (BI) refers to technologies that target
how business information is collected analyzed and presented.
Combining these features results in software called Business
Intelligence Suites. These systems help companies and
organizations to know their business, providing better
decision support, which reflects into a competitive advantage.
Open source suites have the advantage of not increasing costs,
but raise some doubts about its adoption. Evaluate open
source software under a recognized method is important to
ensure its quality. In this paper we evaluate an Open Source
Business Intelligence Suite, using OpenBRR (Business
Readiness Rating for Open Source), an open source software
assessment methodology.
1. INTRODUCTION
The term Business Intelligence (BI) first
appeared in 1958, defined by H. P. Luhn in an
article on IBM Journal [1]. This term was
taken again and redefined by Howard Dresner
ANEXO D
2. OPEN BRR
Open Business Readiness Rating (OpenBRR) is
an open source software assessment methodology
defining an open and standard assessment
process. OpenBRR methodology is based on the
assessment over 12 categories: Functionality,
Usability, Quality, Security, Performance,
Scalability,
Architecture,
Support,
Documentation, Adoption, Community and
Professionalism, having each category several
metrics to be assessed.
In this level the grade ranking may have different
levels of importance depending on the
requirements to use the software and the
122
ANEXO D
3. OPENBRR PENTAHO
EVALUATION
ETL
Collaboration
Reporting
Dashboards
Ad-hoc query
Office integration
Mobile BI
3
1
1
2
3
1
1
2
Geo tagging
26
22
Total
Capabilities
OLAP
Interactive
Data Mining
Scorecards
Extra
Weight
Ratin
g
3
2
3
3
2
2
2
3
2
3
3
2
0
2
Categories
Weig
ht
Rating
Usability
15%
5
Quality
15%
1,9
Documentation
10%
5
Community
10%
3,8
Security
5%
5
Architecture
5%
5
Pondering each category marks we get the
final result that is shown in Table 3.
Table 3. OpenBRR final score
Categories
Functionality
Usability
Quality
Documentation
Community
Security
Architecture
Total
Weig
ht
40%
15%
15%
10%
10%
5%
5%
Weighting
1,2
0,75
0,285
0,5
0,38
0,25
0,25
3,615
ANEXO D
4. CONCLUSIONS AND
FUTURE WORK
The application of OpenBRR methodology
becomes useful in this assessment as it offers an
objective evaluation criterion, reproducible and
auditable, assigning a numeric value allowing in
this way the comparison with other evaluations of
other products. The evaluation of Pentaho
Community Edition shows good marks and in the
final score it is rated as good software. As
future work, we intend to evaluate more open
source business intelligence suites in order to set
124
5. REFERENCES
[1] Luhn, H. 1958. A Business Intelligence System, IBM Journal
(Oct. 1958).
[2] Power, D. J. 2007. A Brief History of Decision Support
Systems, version 4.0. (Mar. 2007).
http://dssresources.com/history/dsshistory.html.
[3] Sezes, C., Oliveira, Baptista , J., M. 2006. Business
Intelligence. SPI Sociedade Portuguesa de Inovao.
[4] http://community.pentaho.com/
[5] http://www.qsos.org/
[6] Business Readiness Rating for Open Source - A Proposed
Open Standard to Facilitate Assessment and Adoption of
Open Source Software.
http://master.libresoft.es/sites/default/files/Materiales_MSW
L_2010_2011/Project%20Evaluation/materiales/OpenBRR_
Whitepaper.pdf
[7] Deprez, J. C., Alexandre, S. 2008. Comparing Assessment
Methodologies for Free/Open Source Software: OpenBRR &
QSOS. In CETIC (Charleroi, Belgium, 2008).