Big Data et nouvelle donne
Le site bigdata.fr explicite le concept éponyme de la manière suivante [9]: « Littéralement, ces termes signifient mégadonnées, grosses données ou encore données massives. Ils désignent un ensemble très volumineux de données qu’aucun outil classique de gestion de base de données ou de gestion de l’information ne peut vraiment travailler. […]. Cependant, aucune définition précise ou universelle ne peut être donnée au Big Data. Etant un objet complexe polymorphe, sa définition varie selon les communautés qui s’y intéressent en tant qu’usager ou fournisseur de services ».
Le Big Data peut être vu comme un phénomène majeur marquant une nouvelle ère : les sociétés modernes doivent désormais composer avec la collecte et la profusion de données mais surtout avec l’ensemble des enjeux qui en découlent : impacts économiques et sociétaux. Tout cela est encore très souvent mal compris. Les quantités de données considérables découlent de trois phénomènes comme l’explique Jean-Daniel Fekete [10]:
« 1. la capacité de stockage a augmenté de façon exponentielle et nous pouvons trouver des disques durs de plusieurs téraoctets (milliers de milliards d’octets) pour moins de 100 €,
2. nous capturons des données à une vitesse jamais égalée avec nos satellites, nos capteurs de pollution, nos dossiers médicaux informatisés, nos enregistrements de transactions informatisées, les articles mis en ligne sur le Web, etc.
3. les archives de données collectées depuis la nuit des temps sont maintenant mises à disposition sur Internet, DVD ou serveurs de données accessibles en ligne. »
On utilise souvent les 3 V : Volume, Vélocité, Variété pour caractériser le big data mais le considérer uniquement comme un « seul » gros volume de données et le traduire ainsi est réducteur : ce n’est pas vraiment la quantité de données qui fait la nouveauté mais plutôt la combinaison [11] des 3 V.
De nombreux experts et observateurs considèrent que le Big Data est aussi déterminant que la révolution industrielle tant il ouvre nombre de perspectives dans tous les secteurs de l’économie. Il fédère en outre une multitude de communautés d’intérêt, pluridisciplinaires.
Business Intelligence et le Big Data
« Et le Big Data, alors ? On parlait d’entrepôt de données précédemment ! Le Big data, entre-t-il dans la Business intelligence ? Je suis un peu perdu là »
Pas de panique ! Il est toujours délicat de mettre en rapport des termes de ce type car ce sont ce que l’on appelle des buzzwords. Nous entendons précisément par buzzword [12] un « terme ou une expression de jargon qui est utilisée, pendant une certaine période, comme slogan pour désigner une nouveauté (technologie, produit, concept, etc.) et ainsi attirer l’attention sur cette nouveauté. Son utilisation donne l’impression qu’il s’agit de quelque chose d’important et à la mode ainsi qu’une impression de compétence auprès du public ».
La business intelligence, dans l’acception proposé précédemment, a globalement 25-30 ans, voire davantage selon les degrés de maturité, et selon ce que l’on met derrière ces domaines et termes.
Professionnels et experts ne sont d’ailleurs pas toujours d’accord.
Elle vise à mettre en œuvre des indicateurs basés sur les systèmes d’information « interne », c’est-à-dire les applications de l’entreprise, pour constituer des tableaux en bord en vue d’ « aider à la décision ». Le problème avec les buzzwords, c’est aussi qu’ils représentent une innovation « nommée » dans leur contexte bien précis. C’est comme imaginer de faire allusion à des « nouvelles » technologies de l’information et de la communication (NTIC) en 2050. Elles sont nouvelles, celles-là, fin des années 1990, début des années 2000 même si, bien sûr, elles continuent de progresser. L’appellation « art contemporain » peut être un autre exemple illustratif dans un registre totalement différent.
Il faut en outre bien avoir à l’esprit que le terme intelligence est très connoté renseignement chez les anglo-saxons. Buzzwords et décalage linguistique (voire culturel) n’aident pas !
Le big data ne recouvre pas forcément les mêmes choses selon les agents économiques qui prononcent cette expression. Il devient aussi un écosystème économique [13]. Précédemment, il a été explicité comme un phénomène mais les marketeurs de solutions logicielles aiment à semer une certaine confusion en mélangeant le phénomène et les technologies pour l’exploiter. Ils ajoutent parfois des V comme « Vérité » ou « Valeur » !
Différence avec l’informatique décisionnelle
La principale différence concerne les données et leur utilisation [14] :
D’un côté, l’informatique décisionnelle porte sur l’utilisation de statistiques descriptives et sur des données à forte densité en information afin de mesurer des phénomènes, détecter des tendances… ; pour mémoire, la statistique descriptive [15] « vise à décrire de façon synthétique et parlante des données observées pour mieux les analyser ».
De l’autre, comme le résume bien Wikipédia, le Big data mobilise des compétences pour utiliser des « statistiques inférentielles, sur des données à faible densité en information dont le grand volume permet d’inférer des lois […] donnant dès lors […] au big data des capacités prédictives [16]. […] L’informatique traditionnelle, informatique décisionnelle comprise, est basée sur un modèle du monde ; le big data vise à ce que les mathématiques trouvent un modèle dans les données ».
Alors que la complexité va continuer d’augmenter, la principale valeur ajoutée des Big Data réside dans l’analyse [17] :
- Prédiction : qu’est-ce qui est le plus susceptible de se produire ?
- Estimation : quelle est la valeur future d’une variable ?
- Description : quelles relations existent dans les données ?
- Simulation : que pourrait-il arriver ?
- Prescription : que doit-on faire [18] ?
Les finalités ne sont pas donc les mêmes. Le principal changement résulte non pas des technologies mais surtout du changement d’architecture qu’implique le management du Big Data pour des questions stratégiques.
NOTES————————————————————–
[9] « Définition : Qu’est-ce que le Big Data ? », [En ligne : http://www.lebigdata.fr/definition-big-data]. Consulté le 7 juin 2017.
[10] Jean-Daniel Fekete, « La visualisation analytique, pour comprendre des données complexes », [En ligne : https://interstices.info/vismaster]. Consulté le 12 mars 2016.
[11] Anne-Cécile Fouchard, « Perdu(e) dans la définition du “Big Data”? », [En ligne : http://www.theaccessgroup.fr/ressources/blogs/perdu-e-dans-la-d{b23bcbc6564704ae5314c50cf6e55ef99bc09de32ef3fcb54190da321a083ca4}C3{b23bcbc6564704ae5314c50cf6e55ef99bc09de32ef3fcb54190da321a083ca4}A9finition-du-big-data/]. Consulté le 3 juin 2017.
[12] Wikipedia, « Buzzword », [En ligne : https://fr.wikipedia.org/w/index.php?title=Buzzword&oldid=138016653]. Consulté le 1er juin 2017.
[13] Michel Cartier, « Le 21e siècle : le Big Data », [En ligne : http://www.21siecle.quebec/table-des-matieres-2/le-big-data/]. Consulté le 19 mai 2017.
[14] Wikipedia, « Big data », [En ligne : https://fr.wikipedia.org/w/index.php?title=Big_data&oldid=138130937]. Consulté le 29 mai 2017.
[15] Antoine Ayache et Julien Hamonier, « Cours de Statistique Descriptive », [En ligne : http://math.univ-lille1.fr/~ayache/cours_SD.pdf]. Consulté le 10 juin 2017.
[16] Wikipedia, op. cit.
[17] Mark Madsen, « Bi isn’t big data and big data isn’t BI », 05:55:14 UTC.
[18] Ibidem.
Poster un Commentaire
Vous devez vous connecter pour publier un commentaire.