Vous êtes responsable du pôle Valorisation des données au sein de la Banque Postale. Les activités de votre pôle sont en lien direct avec le Big Data et la gouvernance des données. Pouvez-vous définir plus précisément votre organisation, son positionnement, son activité ?
Mon pôle est rattaché au Chief Data Officier (CDO) de la Banque Postale, c’est-à-dire le responsable de la gouvernance des données qui lui-même est rattaché à la directrice financière.
Le CDO est responsable de la direction Data Management qui contient plusieurs pôles : celui dont j’ai la responsabilité, un pôle de gouvernance des données, qui répond pleinement à cette thématique, un pôle data visualisation et un pôle pilotage commercial.
Initialement, mon pôle a été construit sur les équipes de la maîtrise d’ouvrage du système d’information décisionnel de la banque postale. Les données de ce dernier sont utilisées par l’ensemble des métiers de la banque, comme par exemple la direction marketing, la direction des risques…
Le CDO a été nommé il y a un peu moins d’un an, il a récupéré mon équipe et a décidé d’en élargir les compétences. Il a voulu conserver la maîtrise d’ouvrage du DataWarehouse qui est parfaitement maîtrisé et très utilisé. Par ailleurs, Il a voulu intégrer un système de veille qui a pour ambition de faire des POC (Preuve de Concept) afin d’évaluer ce que la banque postale peut exploiter, développer en matière de Big Data.
La banque postale a donc un énorme pôle concentré tout autour des données, de la gouvernance de ces dernières, à la gestion de leurs évolutions. Le CDO est le chef d’orchestre de cette ambition. Il a le rôle de gestionnaire de la gouvernance des données, par exemple par le biais d’établissement de chartes. Il a aussi un rôle lié à la valorisation de la donnée à savoir définir la valeur de cette dernière afin d’estimer s’il faut l’exploiter.
Pouvez-vous décrire les données massives traitées, utilisées et également décrire leur évolution ?
Le Big Data est considéré comme une évolution de ce que la banque faisait déjà auparavant. La banque a toujours traité des données. Aujourd’hui elles sont plus importantes, plus volumineuses. La Banque Postale est jeune, elle a une dizaine d’années, son DataWarehouse existe depuis le même nombre d’années. C’est un entrepôt de données qui regroupe des données structurées. Cet entrepôt possède des milliers de données, de tables…
En terme de volumétrie, il représente plusieurs dizaines de téraoctets.
Au sein de la Banque Postale, nous parlons du Big Data en terme de volume. La banque dispose des données sur l’ensemble de ses clients et de ses contrats. Ces derniers représentent plusieurs dizaines de millions de clients et plusieurs centaines de millions de contrats. D’autres données conservées sont, par exemple, la fréquentation de nos clients dans les bureaux de postes. Nous avons 17000 points de contact, cela représente un gisement de données énorme que nous exploitons déjà mais que nous voulons encore développer. Notre ambition est également d’étendre l’activité sur le web car ces données sont stockées mais pas suffisamment exploitées.
Aujourd’hui les données structurées sont parfaitement maîtrisées. L’objectif serait de s’intéresser davantage aux données non structurées en interne comme par exemple les appels et les emails que font les clients aux conseillers, mais aussi celles qui sont externes (les réseaux sociaux). La donnée non-structurée n’est pas encore exploitée. Le CDO a donc mis en place une cellule de veille pour parvenir à mieux appréhender ces données. Nous sommes en mode exploratoire. Par exemple, mon service travaille sur l’ensemble des relevés bancaires des clients, mais nous ne traitons pas le libellé des opérations de ces relevés. Nous travaillons sur le montant, la date et les codes mais nous ne cherchons pas à savoir ce que le client a acheté. Cela s’explique par le fait que quand le DataWarehouse a été construit, nous ne savions pas exploiter ces données et le volume était un problème à l’époque. Aujourd’hui, nous ne sommes plus limités par le stockage donc nous aimerions exploiter ces libellés car nous pensons qu’il y a un véritable potentiel d’exploitation d’un point de vue commercial, marketing … Nous souhaitons le faire en respectant la réglementation, en respectant les codes éthiques. La banque postale a de vraies valeurs éthiques.
L’évolution des données massives est réelle. Pour gérer, exploiter et industrialiser les données relative au Big Data et notamment les données non structurées, le groupe La Poste est doté d’une plateforme Big Data que la banque utilise pour déposer des données et faire des POC, pour élaborer des algorithmes afin de mesurer le taux de churn, d’attrition c’est-à-dire établir des analyses pour anticiper par exemple le départ de nos clients. La plateforme est basée sur le framework hadoop. Sur cette plateforme, on peut faire la fouille et la préparation des données, puis la préparation et le paramétrage des algorithmes et enfin si les algorithmes donnent des résultats satisfaisants tenter la mise en production. Nous traitons environ dix projets à ce jour.
Le Big Data est donc en évolution constante au sein de la Banque Postale, comment sont gouvernées ses données ?
La Banque Postale dépend du groupe La Poste qui a édité une charte data qui indique comment exploiter la donnée. Cette charte explique que les données doivent être protégées de façon éthique. Les données doivent être respectées et traitées avec la plus grande vigilance. La Poste et la Banque Postale ont donc une volonté forte de gouverner les données.
Aujourd’hui, nous écrivons une charte spécifique à la Banque Postale qui bien évidemment ne contredit pas la charte de La Poste mais qui va la compléter et la développer notamment sur les réglementations qui sont spécifiques au monde bancaire. Cette charte sera validée par le Comex de la banque, elle est en cours de rédaction. Elle décrit ce que nous devons faire et ce que nous voulons faire en termes de maîtrise des données et de qualité de la donnée.
Mettez-vous en place des procédures particulières ? Quels sont les points essentiels à la mise en place de la gouvernance des données ?
La gouvernance des données se fait dans un premier temps en référençant les données. Il faut faire une cartographie, donner une définition métier et mettre en place un contrôle qualité de la donnée. Il s’agit de mettre en place un process pour s’assurer, mesurer et augmenter la qualité des données.
La gouvernance des données ne peut se faire que si les responsables de la donnée sont clairement définis. Les propriétaires des données, que l’on a nommé DataManager, ont été nommés dans chacune des directions de la banque. Leur premier rôle est de déterminer le périmètre de leurs données. Cela peut nécessiter des discussions avec le CDO. Le but est d’établir le paradigme qu’une donnée a forcément un propriétaire. Ils ont pour mission de donner une définition métier et s’assurer de la maîtrise de ces données. Cela passe par des plans d’action de mise en qualité des données pour s’assurer de la justesse de celles-ci. Par exemple, la date de naissance du client est-elle correcte ? Cette date est saisie par un conseiller, elle est ensuite diffusée dans tout le Système d’information (SI), il faut s’assurer que la saisie et la diffusion soient correctes.
Pour cela dans le SI, des contrôles qualité sont mis en place par le biais de tableaux de bord qui incluent des indicateurs, des KPI (indicateurs clés de performance) qui sont calculés de manière mensuelle et qui ont pour but de vérifier qu’il n’y a pas de déperdition de qualité sur les données. Par contre, nous n’utilisons pas aujourd’hui un outil de Data Quality. Mais la mise en place d’un tel outil ou non est une des missions de CDO.
Nous produisons un reporting nommé COREP qui est propre aux banques et qui a pour objectif de déterminer des ratios de solvabilité calculés à partir de plusieurs dizaines voire centaines de données qui proviennent de l’ensemble du SI. Dans ce cadre, nous avons dû établir un schéma global des flux de données du SI et donc de positionner les propriétaires des données, savoir s’il y en a bien à chaque flux, nœud, jointure, à chaque transformation.
Ces éléments ont été formalisés dans un dictionnaire de données. La Banque Postale est très avancée sur l’élaboration de ce dictionnaire car il est historique et référence la plus grande partie des données qui sont dans le SI décisionnel. Le dictionnaire est technique et décrit les tables et les colonnes et les définit. Le dictionnaire est plus orienté système décisionnel qu’opérationnel. La description du système opérationnel est moins structurée et plus éclatée, non centralisée dans un même outil. L’évolution du dictionnaire veut aussi prendre en compte cette lacune. Il s’agit d’une volonté interne de mieux comprendre les données qui nous alimentent.
En plus de cette volonté interne, les banques sont dans un environnement réglementaire très contraint et fréquemment audité, pouvez-vous nous en parler ?
Nous sommes soumis à Bâle III qui a un volet sur la gouvernance et la qualité de la donnée. Nous devons aussi respecter la directive Solvency II car nous sommes une banque assureur. Nous devons par ailleurs prendre en compte les principes BCBS 239 qui ont pour objectif de mettre en place une meilleure qualité des données de reportings réglementaires. Cette norme, édictée par le comité de Bâle est applicable à l’ensemble des banques européennes. La première exigence de la norme est de nommer un CDO pour mettre en place une gouvernance des données qui correspond aux exigences de la norme.
Le règlement général de l’Union européenne sur la protection des données (RGPD) doit aussi être respecté. Il se complète avec les autres règlementations, il est spécifiquement lié à la protection des personnes. Les autres normes vont plus loin car définissent l’ensemble des aspects de la donnée, la qualité…
Le respect de la réglementation sur Bâle III et Solvency II a été validé suite à un audit. II y a eu quelques recommandations mais la Banque Postale respecte bien les obligations.
Concernant RGPD et BCBS239 qui vont beaucoup plus loin, nous ne sommes pas encore au niveau requis mais c’est également le cas de l’ensemble des banques et ces normes ne sont pas encore applicables (2018). Pour faire face, nous mettons en place un programme de transformation de la banque qui est sous gouvernance du CDO. Le projet est lancé et officialisé.
Plus spécifiquement quelles sont vos obligations ?
On doit anonymiser les données. Dans le DataWarehouse, nous cachons les données nominatives (nom, prénom, mail, téléphone,
etc…) mais nous devons pouvoir les rendre disponibles au corps de contrôle qui est composé de l’inspection générale et de la direction de la conformité. Cependant il faut savoir que dans le cadre de la CNIL, nous pouvons tout de même utiliser ces données pour des besoins marketing, si ce besoin est justifié et validé par le CIL (Correspondant informatique et liberté). Par exemple, quand nous faisons des campagnes marketing, nous avons besoin du nom et du prénom de la personne donc l’autorisation est donnée mais uniquement dans le cadre d’un process avec le CIL. Dans le cadre de RGBD le process ira plus loin car nous ne pourrons faire que ce que le client nous a autorisé spécifiquement de faire. Si nous voulons faire un score marketing d’appétence au crédit consommation, nous devrons faire cocher une case mentionnant l’acceptation d’utilisation des données personnelles… Cela nécessitera un travail important de recueil d’autorisation. La nouvelle norme impose aussi que le client puisse visualiser les données que les organismes possèdent sur lui. Il faut comprendre la réglementation car comment demander l’autorisation si nous ne pouvons pas utiliser les noms….Il faut donc véritablement s’approprier la norme pour la mise en place opérationnelle.
Pour voir si nous sommes conformes nous serons certainement audités tout comme pour les autres réglementations, l’audit nous permettra de mieux nous situer, d’avoir des recommandations d’amélioration qu’il faudra mettre en place. Nous sommes déjà en ordre de marche, un programme est lancé pour atteindre les objectifs.
Quels seraient vos mots pour conclure ?
La Banque Postale est une banque éthique qui se donne les moyens de mettre en place une véritable gouvernance des données par le biais d’initiatives internes et par le respect des réglementations. L’objectif désormais est d’établir une meilleure exploitation de la donnée non structurée. La gestion des données est un sujet sensible mais une bonne gouvernance peut limiter les dérives…
Finalement le véritable risque serait de ne pas saisir l’opportunité, le risque de ne pas faire et du prendre du retard par rapport aux autres banques et aux FinTech.
Interview de Céline Jourdren
Auprès de Pierre Savary de Beauregard
Paris, le 14 mars 2017
Poster un Commentaire
Vous devez vous connecter pour publier un commentaire.