Big Data et gouvernance des données (approche simple et non technique)

Les enjeux pour les entreprises : la gouvernance des données

Les données en entreprise (Source : Pixabay)
Les données en entreprise (Source : Pixabay)

Face à cette infobésité, cette multiplication des sources et des typologies des données internes et externes, les entreprises doivent s’organiser. Comme illustré ci-dessus, cette marée noire impacte les relations BtoB, BtoC et CtoC.

Le nouvel or noir doit être intégré dans la stratégie d’entreprise et doit devenir un outil de création de valeur. Il donne une connaissance plus affinée de l’environnement dans lequel tout organisme évolue et doit devenir un outil d’aide à la décision.

L’organisme ne doit garder de cette pluie torrentielle de données que l’eau vitale à son fonctionnement, son évolution et sa pérennité. Elle gagne ainsi en agilité afin de mieux s’adapter aux attentes de ses parties prenantes mais détecte, également, les « signaux faibles » pour innover et identifier de nouvelles opportunités.

L’entreprise doit chercher, filtrer, traiter les informations de façon à les transformer en connaissance stratégique selon un but : meilleure approche des marchés, évaluation de sa réputation, … L’information doit être vulgarisée, simplifiée, résumée « pour la rendre accessible et interprétable à toute personne qui en a besoin pour décider »[9].

Mais comment faire ?

La gouvernance des données

Il ne s’agit pas pour les entreprises de collecter des données à tout va mais de déterminer au préalable une stratégie, avec des objectifs, des méthodes, des règles d’usage des données, des outils et des responsables nommés. Ces personnes doivent avoir la compétence pour juger de la qualité, de la sûreté et de la fiabilité des informations collectées dans leur contexte, pour y apporter une valeur ajoutée, leur donner du sens. Les informations se managent.

Une approche systémique de l’entreprise et de ses métiers est essentielle. Identifier ses parties prenantes, ses risques et opportunités permet une définition plus précise du besoin des utilisateurs de l’information en interne.

Gouverner les données commence donc par la question du pourquoi et à quelle fin, dans un cadre précis. En effet, collecter et analyser les datas répondent à un besoin bien défini, comme vu dans les exemples traités précédemment en Marketing ou Politique.

Les organisations ont tendance à souvent faire l’impasse sur cette phase de réflexion. L’amalgame est fait entre Big Data et solutions informatiques. Mais comme pour tout choix d’outil, ce dernier doit avant tout répondre à un besoin, lui-même intégré dans la stratégie globale de l’entité. Ce n’est qu’après avoir défini sa stratégie que l’on peut réfléchir au comment et donc à l’outil informatique le plus adapté.

Cette solution doit prendre en compte le caractère hétéroclite des data, à structurer et à indexer en temps réel, grâce aux référentiels métiers et aux ontologies [10] et en tout respect de la propriété intellectuelle et de la vie privée.

Pourquoi hétéroclite ?

Le flux d’informations centralise des données de tout type dans une organisation :

  • Des données non structurées telles que des documents Word, des fichiers .pdf,
  • Des mails
  • Des éléments de bases de données externes : Hadoop, MySQL
  • Des ressources web : pages web, google analytics, portails publics institutionnels, journaux, …
  • Les flux de commentaires sur les blogs, les réseaux sociaux
  • Des données centralisées sur des bases de données internes sur Excel, ACCESS ou outils spécifiques de GED (Gestion Electronique du Document) ou Intranet, données dites structurées par des métadonnées.

Autant de domaines et de sources à prendre en compte que de nouvelles compétences à intégrer dans les ressources d’un organisme.

Il s’agit là d’une véritable transformation du modèle économique habituel. Ce qui explique une majorité des freins identifiés actuellement dans les entreprises : nouvelles stratégies, évolutions organisationnelles et technologiques.

La gouvernance des données est une affaire de technologie, certes, mais surtout d’actions sur les hommes et les processus. Pour manager ce flux d’informations externes, l’entreprise doit d’abord cadrer son système d’informations interne. Elle doit sortir de sa vision informatique du sujet pour tendre vers une gouvernance de son patrimoine informationnel.

Le bémol

L’exploitation des données Big Data est régulièrement un sujet sensible car il touche à la vie privée, à l’intimité des utilisateurs.

Les bases de données qui stockent nos données sont comparées à des « Systèmes totalitaires capables de nous contrôler, nous surveiller ou nous influencer »[11]

Le parallèle est régulièrement fait avec l’ouvrage 1984, de George Orwell, publié en 1949. L’aspect « Big Brother is watching you » pose la question de la limite entre vie privée et vie publique.

Les utilisateurs connectés ne donnent pas leur accord explicite sur cet usage gratuit de leurs données.

Des sites comme Facebook ont intégré dans leurs informations une page expliquant à l’utilisateur les « coulisses » des annonceurs et proposent d’affiner le paramétrage du profil.

Encore faut-il être conscient de ces usages et de prendre le temps de chercher et lire les informations… En effet, il est souvent reprocher l’absence d’informations ou le manque de visibilité sur l’exploitation des données collectées et stockées par les sites.

Les institutions souhaitent mettre en place des autorités de contrôle pour une éthique Big Data. Des textes de lois sont parus pour légiférer la protection des données personnelles. Le General Data Protection Regulation EU 2016/679 a été voté le 27 avril dernier avec pour objectif :

  • « consolider les droits des personnes physiques,
  • renforcer les pouvoirs des autorités européennes et
  • responsabiliser les entreprises qui traitent les données à caractère personnel. » qui renforce le « droit à l’oubli, ainsi que le droit à la portabilité des données et à l’opposition de toute opération marketing. » [12]

 

Le Big Data est nourri de nos pratiques numériques quotidiennes, qu’elles soient personnelles ou professionnelles et offre ainsi de belles opportunités de sources informationnelles à certaines industries.

Le cadre juridique posé nous permettra de rester maître, autant que faire se peut, de nos informations. Nous aurons le choix de contribuer à cette transformation digitale de notre système économique.

Mais ce qu’il ressort de cette étude est que ce soit à titre individuel ou dans un contexte d’entreprise, il est essentiel aujourd’hui de cadrer et structurer notre patrimoine d’informations afin de le maîtriser et de pouvoir le faire évoluer.

Big Data is watching you… but don’t be afraid ! and keep the control…[13]

NOTES——————————————————-

[9] Big Data : face à l’abondance, l’entreprise doit gérer la rareté, 23 février 2012, http://archives.lesechos.fr/archives/cercle/2012/02/23/cercle_43767.htm#f6CMH4OREqjt5ICu.99http://archives.lesechos.fr/archives/cercle/2012/02/23/cercle_43767.htm#f6CMH4OREqjt5ICu.99

[10] Définition Wikipédia : ensemble structuré des termes et concepts représentant le sens d’un champ d’informations, que ce soit par les métadonnées d’un espace de noms, ou les éléments d’un domaine de connaissances

[11] Big Data et données personnelles: vers une gouvernance éthique des algorithmes, Jérôme Béranger, 22 décembre 2014, http://parisinnovationreview.com/2014/12/22/big-data-ethique/

[12] Protection des données personnelles : qu’est-ce que la nouvelle règlementation va changer ?, DOMINIQUE POURCHET , le 07 mars 2017, lien : https://www.lesechos.fr/idees-debats/cercle/cercle-167196-protection-des-donnees-personnelles-quest-ce-que-la-nouvelle-reglementation-va-changer-2070321.php#WkCUwYAhpJiWIDsA.99

[13] Le Big Data vous observe mais n’ayez pas peur ! et gardez le contrôle…

Soyez le premier à commenter

Poster un Commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.