Professional Documents
Culture Documents
Chp1 : Introduction
Approche et Vocabulaire
2
Intrts
Introduction aux Big Data
3
Sources
Introduction aux Big Data
4
Challenges
Introduction aux Big Data
5
Les 5 V
Introduction aux Big Data
Volume ( Volume ) -
-
Traoctets
Enreg. / Archives
-
-
Batch
Temps rl
- Transactions - Processus
- Tables, fichiers - Flot de donnes
Varit ( Variety )
Varit Valeur
5 Vs du
- Structures Big Data - Statistiques
- Non structures
Vitesse ( Velocity ) - Multi-facteur
-
-
vnements
Corrlations
- Probabilistes - Hypothtiques
- Confiance
- Authenticit
Vracit ( Veracity) - Origine, rputation
- Disponibilit
- Responsabilit
Vracit
Valeur (Value)
6
Volume
Introduction aux Big Data
Le prix de stockage des donnes a beaucoup diminu ces
30 dernires annes:
De $100,000 / Go (1980)
$0.10 / Go (2013)
Les lieux de stockage fiables (comme des SAN: Storage
Area Network) ou rseaux de stockage peuvent tre trs Volume Vitesse
coteux
Choisir de ne stocker que certaines donnes, juges - Traoctets - Batch
sensibles - Enreg. / Archives - Temps rl
- Transactions - Processus
Perte de donnes, pouvant tre trs utiles, comme les logs - Tables, fichiers - Flot de donnes
7
Varit
Introduction aux Big Data
Pour un stockage dans des bases de donnes ou
dans des entrepts de donnes, les donnes
doivent respecter un format prdfini.
La plupart des donnes existantes sont non-
structures ou semi-structures
Volume Vitesse
Donnes sous plusieurs formats et types
On veut tout stocker: -
-
Traoctets
Enreg. / Archives
-
-
Batch
Temps rl
Exemple : pour une discussion dans un centre -
-
Transactions
Tables, fichiers
- Processus
- Flot de donnes
dappel, on peut la stocker sous forme textuelle
pour son contenu, comme on peut stocker
lenregistrement en entier, pour interprter le ton Varit Valeur
5 Vs du
de voix du client - Structures Big Data - Statistiques
- Non structures
Certaines donnes peuvent paratre obsoltes, - Multi-facteur
-
-
vnements
Corrlations
mais sont utiles pour certaines dcisions: - Probabilistes - Hypothtiques
- Confiance
Exemple : Pour le transport de marchandise, on a - Authenticit
tendance choisir le camion le plus proche. Mais - Origine, rputation
parfois, ce nest pas la meilleure solution. -
-
Disponibilit
Responsabilit
Dautres problmes peuvent intervenir.
Besoin de : Donnes GPS, Plan de livraison du Vracit
camion, Circulation, Chargement du camion,
Niveau dessence
8
Vitesse
Introduction aux Big Data
Rapidit darrive des donnes
Vitesse de traitement
Les donnes doivent tre stockes
larrive, parfois mme des Volume Vitesse
9
Vracit
Introduction aux Big Data
Cela fait rfrence au dsordre ou la
fiabilit des donnes. Avec laugmentation
de la quantit, la qualit et prcision se
perdent (abrviations, typos,
dformations, source peu fiable) Volume Vitesse
Les solutions Big Data doivent remdier - Traoctets - Batch
- Enreg. / Archives - Temps rl
cela en se rfrant au volume des donnes - Transactions - Processus
- Tables, fichiers
existantes - Flot de donnes
10
Valeur
Introduction aux Big Data
Le V le plus important
Il faut transformer toutes les donnes Volume Vitesse
en valeurs exploitables: les donnes - Traoctets - Batch
sans valeur sont inutiles -
-
Enreg. / Archives
Transactions
-
-
Temps rl
Processus
- Tables, fichiers - Flot de donnes
Vracit
11
Approche Traditionnelle
Introduction aux Big Data
Les besoins mtier guident la conception de la solution
De nouvelles exigences
ncessitent une nouvelle
conception et construction IT conoit une solution avec un
ensemble de structures et
fonctionnalits
12
Approche Traditionnelle
Introduction aux Big Data
Approprie pour:
13
Approche Big Data
Introduction aux Big Data
Les sources dinformation guident la dcouverte crative
Le responsable mtier et IT
identifient les sources de donnes
disponibles
14
Approche Big Data vs Approche Traditionnelle
Introduction aux Big Data
15
Approche Big Data vs Approche Traditionnelle
Introduction aux Big Data
Approche Traditionnelle Approche Big Data
Analyse Structure et Rpte Analyse Itrative et Exploratoire
16
Sources
Introduction aux Big Data
Cours
Big Data Analytics Lesson 1: What is Big Data , IBM, Big Data University
Intro to Hadoop and MapReduce , Coursera, Udacity
Articles
Bernard Marr, Big Data: The 5 Vs Everyone Must Know , LinkedIn
17