Professional Documents
Culture Documents
1. Introduction
A. Entrepts de donnes : Gnralits
B. Entrepts orients processus mtiers
2. Etat de lart : synthse
3. Motivations
4. Problmatique
2. Principe de fonctionnement
Intgration
Dans les faits, les donnes alimentant l'Entrept de donnes sont htrognes, issues de
diffrentes applications de production, voire de fichiers dits "plats" (fichiers Excel,
fichiers texte, XML...). Il sagit alors de les intgrer, de les homogniser et de leur
donner un sens unique comprhensible par tous les utilisateurs. La transversalit
recherche sera dautant plus efficace que le systme dinformation sera rellement
intgr dans sa globalit. Cette intgration ncessite notamment :
une forte activit de normalisation et de rationalisation, oriente vers la qualit ;
une bonne gestion des rfrentiels, incluant une vrification constante de leur
intgrit ;
une parfaite matrise de la smantique et des rgles de gestion des mtadonnes
manipules.
La problmatique de l'intgration repose sur la standardisation de donnes internes
l'entreprise, mais aussi des donnes externes (provenant par exemple de clients ou de
fournisseurs).
Ce nest quau prix dune intgration pousse que lon peut offrir une vision homogne
et vritablement transverse de lentreprise. Ceci suppose que le systme dinformation
de lentreprise en amont soit bien structur, bien matris, et bnficie dj dun niveau
dintgration suffisant. Si tel n'est pas le cas, la mauvaise qualit des donnes peut
empcher la mise en uvre de l'entrept de donnes.
Historisation
L'historisation d'un Datawarehouse repose sur le principe de conservation des
donnes (ou de non-volatilit des donnes). Afin de conserver la traabilit des
informations et des dcisions prises, les donnes une fois entres dans l'Entrept sont
stables, en lecture seule, non modifiables par les utilisateurs. Une mme requte lance
plusieurs fois diffrents moments doit ainsi restituer les mmes rsultats. Ds quune
donne est qualifie pour tre introduite dans l'Entrept de donnes, elle ne peut donc
plus tre altre, modifie ou supprime (en del dun certain dlai de purge). Elle
devient, de fait, partie intgrante de lhistorique de lentreprise.
Le principe de non-volatilit tranche avec la logique des systmes de production, qui
bien souvent remettent jour les donnes par annule et remplace chaque nouvelle
transaction. Chaque donne collecte se voit affecter une date ou un numro de version
pour viter de recouvrir une information dj prsente dans la base de donnes, et
permettre de suivre son volution au cours du temps. Il y a de cette manire
conservation de l'historique.
Dun point de vue fonctionnel, cette proprit permet de suivre dans le temps
lvolution des indicateurs et de raliser des analyses comparatives (par exemple, les
ventes d'une anne sur l'autre). De ce fait, dans un entrept de donnes, un rfrentiel
de temps unique est ncessaire.
Organisation fonctionnelle
L'Entrept de donnes intgre au sein d'une mme base les informations provenant de
multiples applications oprationnelles. On passe ainsi dune vision verticale de
lentreprise, dicte par des contraintes techniques, une vision transversale, dicte par
le besoin mtier, qui permet de croiser fonctionnellement les informations. Lintrt de
cette organisation est de disposer de lensemble des informations utiles sur un sujet le
plus souvent transversal aux structures fonctionnelles (services) de lentreprise. On dit
que l'Entrept de donnes est orient mtier , en rponse aux diffrents mtiers de
lentreprise dont il prpare lanalyse.
D'un point de vue conceptuel, les donnes d'un Data warehouse sont interprtables
sous forme d' indicateurs rpartis selon des axes (ou dimensions) : par exemple, le
nombre de clients (indicateur) rparti par jour de vente, magasin ou segment de
clientle (axes). Techniquement, la modlisation de l'Entrept de donnes peut
matrialiser cette organisation sous forme de tables de fait ou et de tables de
rfrentiel.
Structure de donnes
L'Entrept de donnes a une structure de donnes qui peut en gnral tre reprsente
par un modle de donnes normalis 3FN ((en)3NF) pour les donnes de dtail et/ou
en toile ou en flocon pour les donnes agrges et ce dans un SGBD relationnel
(notamment lorsqu'il s'agit de donnes lmentaires ou unitaires non agrges). La
traduction technique de ce modle se fait souvent au sein d'un cube OLAP.
L'Entrept de donnes est conu pour contenir les donnes en adquation avec les
besoins de lorganisation, et rpondre de manire centralise tous les utilisateurs.
Ainsi, il nexiste pas de rgle unique en matire de stockage ou de modlisation.
Ainsi, ces donnes peuvent donc tre conserves :
de prfrence, sous forme lmentaire et dtaille (exemple : pour une banque,
chaque opration sur chaque compte de chaque client) si la volumtrie le
permet. Les donnes lmentaires prsentent des avantages vidents
(profondeur et niveau de dtail, possibilit d'appliquer de nouveaux axes
d'analyse et mme de revenir a posteriori sur le pass ) mais reprsentent un
plus grand volume et ncessitent donc des matriels plus performants.
ventuellement, sous forme agrge selon les axes ou dimensions d'analyse
prvus (mais ces agrgations sont plutt ralises dans les datamarts que dans
les entrepts de donnes proprement dits). Les donnes agrges prsentent
d'autres avantages (facilit d'analyse, rapidit d'accs, moindre volume). Par
contre, il est impossible de retrouver le dtail et la profondeur des indicateurs
une fois ceux-ci agrgs : on prend le risque de figer les donnes selon une
certaine vue avec les axes d'agrgation retenus, et de ne plus pouvoir revenir sur
ces critres si l'on n'a pas conserv le dtail (par exemple, si l'on a agrg les
rsultats par mois, il ne sera plus possible de faire une analyse par journe).
groupes plus clairs. La fouille des nuds dossiers peut rsulter de la dcouverte
processus-relations centrales (ex. instances de processus) et les abstractions (ex.
modle de processus) qui peuvent tre stocks dans des nuds chemin pour les
analyses futures. Le langage de requtes, c..d. FPSPARQL, dfinie comme une
extension du SPARQL pour la manipulation et linterrogation des entits, les nuds
chemin et dossier. Pour valuer le bon fonctionnement du FPSPARQL, on a conduit
les expriences travers un large registre dvnements.
La prochaine chose qui doit tre trait pendant lanalyse est lampleur du problme
quon va aborder. Cest la slection parmi diffrentes contraintes pour que le problme
soit abord, par exemple un nouveau systme qui manipule uniquement des ordres
d'achat, contre un qui manipule des budgets.
En plus, nous supposons que les objectifs d'organisation sont fixes, ainsi l'analyste
fonctionnel na pas de souci au sujet de cette dimension (dans la pratique, ceci peut ne
pas tre raliste.)
ringnierie des BP
- Les alternatives de lanalyse des besoins qui peuvent impliquer des changements
dans la manire dont une organisation ou entreprise fait les mtiers
- changer lorganisation des BP cest devenu populaire de nos jours et cela se rfre au
BPR(business process reengineering)
- BPR rclame une restructuration nergique et globale d'une organisation qui limine
les limites entre les dpartements et fait que l'organisation se base sur les processus
mtiers globaux, ce qui dfinir ses mtiers.
propose une mthode pour dtecter les fragments doubles dans les modles de
processus. Ces derniers peuvent tre refactoriss en tant que sous-processus spars
afin d'augmenter la lisibilit et l'entretien.
Pour cela une structure d'indexation pour faciliter la dtection rapide des clones dans
de grands entrepts de modle de processus a t prsente. Il prsente une mthode
pour indexer les modles de processus afin d'identifier les fragments SESE doubles
(clones) qui peuvent refactoriss dans des sous-processus spars. Les fragments
SESE (single-entry single-exit) sont lune des conditions que doit supporter la
structure dindex propose. La proposition combine une mthode pour dcomposer les
modles de processus en fragments SESE avec une mthode qui gnre une variable
unique d'un graphe marqu. Cette variable est employe pour dterminer si un
fragment SESE dans un modle apparat ailleurs dans le mme modle ou dans un
autre modle.
Une valuation exprimentale a t effectue avec deux entrepts de modle de
processus. Lobservation dmontre que lapproche de dtection de clone propos
amliore le temps de recherche et mieux encore, peut sadapter sur des entrepts de
catgorie commerciale.
Une autre possibilit serait dteindre la technique propose afin d'identifier les clones
approximatifs. Ceci a des applications dans le cadre de standardisation de processus,
quand les analystes cherchent identifier les fragments semblables mais pas identiques
et les remplacer par les fragments normaliss afin d'augmenter lhomognit des
pratiques en matire de travail.
rsum de sa littrature ; et une liste de dfis (et de quelques solutions potentielles) qui
doivent tre adresss encore. En particulier, nous visons comparer les diffrences
entre questionner les modles de processus mtiers et questionner les graphes
gnrales. Nous discutons galement le travail de littrature de la recherche de
questionnement de graphes qui peut tre employe en questionnant les modles de
processus mtiers.
3. Motivations
les processus mtiers jouent un rle fondamental dans la ralisation de systmes
informatiques rpondant aux objectifs du mtier.
Processus mtiers, partie intgrante de la description dun systme dinformation
Le systme dinformation, particulirement dans une perspective durbanisation,
prsente deux aspects : dun ct celui de ses processus et acteurs, de lautre celui de
ses fonctions logiques et entits informationnelles.
Cest lidentification des processus qui oriente la construction de larchitecture dun
systme dinformation en trois facettes interdpendantes : larchitecture mtier,
larchitecture fonctionnelle et larchitecture informatique.
Le processus est galement au centre de la mise en uvre de certains outils logiciels,
notamment les progiciels intgrs et les outils de gestion de workflow.
4. Problmatique
Plusieurs concepts ont t proposs dans le domaine des
entrepts des donnes, notre projet vise d'avoir une gestion dans
les entrepts pour les processus mtier.