La construction d’un Data Lake s’impose désormais comme « La » stratégie data des entreprises qui se doivent d’exploiter leurs différentes sources de données, si elles souhaitent rester compétitives dans un contexte digital complexe et mouvant. Mais c’est aussi la revanche des métiers sur la technologie car ils se sont affranchis des contraintes liées à celle-ci. La question n’est donc plus le pourquoi mais le comment. Voici 3 conseils pour réussir la mise en place de votre Data Lake.
Mettre la connaissance client au cœur de votre projet
Ce qui motive aujourd’hui le plus la décision de s’équiper d’un Data Lake, c’est d’avoir une meilleure connaissance client. Prérequis au déploiement de nouvelles stratégies de conquête et de fidélisation, la vision client 360° suppose en effet de disposer en temps réel de toutes les données relatives aux consommateurs (SI, BI, CRM, logs, cookies…)
Et quoi de mieux que le Data Lake pour collecter cette masse considérable de données dans un même lieu ? Le Data Lake permet de collecter toutes les données issues des interactions avec les clients et de les enrichir avec une grande variété de données internes (CRM, ERP, …) et externes (réseaux sociaux, géolocalisation, données Insee et autres open data) afin que les organisations puissent mieux cibler les efforts marketing et ainsi gagner en efficacité. Nous pouvons, une fois mis en place, utiliser ce Data Lake pour définir des lakeshores plus fonctionnels qui permettent d’adresser des uses cases sur lesquels la datascience utilise des modèles prédictifs et prescriptifs qui seront les valeurs clefs de succès.
Cela générera de nouvelles données qui viendront à leur tour enrichir le Data Lake et constitueront de nouveaux indicateurs d’analyse.
Ne vous limitez pas dans la collecte de données
Les entreprises sont de plus en plus confrontées aux problématiques de stockage des données et à l’accès à ces dernières par les équipes, quelles que soient leurs formes et provenances. Contrairement à un datawarehouse qui stocke des données structurées dont la finalité et les destinataires sont déterminés en amont, le data lake, lui, stocke toutes les données dans leur format d’origine afin d’éviter de structurer les données a priori mais plutôt a posteriori, lorsque les uses cases sont définis.
En intégrant au même endroit de multiples sources de données, le Data Lake casse enfin les silos, pénalisants dans un environnement aussi évolutif, qui étaient jusqu’alors la norme imposée aux entreprises. Finie la peur de dupliquer les données, le data lake récupère la donnée brute provenant du système d’information de la société et/ou de sources diverses : programme de fidélité, tickets de caisse, données online… La collecte d’informations est systématisée y compris pour celles non utilisées parce que leur stockage demande peu d’efforts et des coûts faibles. Les métiers disposent ainsi d’une multitude de données qu’ils peuvent interroger et analyser quand bon leur semble en fonction de leurs use cases. Résultat : un time-to-market considérablement réduit.
Data Lake et Data Science, le duo gagnant.
Le Data Lake n’est pas une fin en soi mais un puissant socle technique rendant les données disponibles afin de les valoriser et de les activer. Ce n’est cependant que la première pierre de l’édifice à laquelle il est indispensable d’associer une équipe.
Tout l’enjeu réside dans les corrélations pertinentes à révéler entre les données, à repondre et/ou créer de nouveaux cas d’usage et dans la capacité des métiers à s’approprier ces corrélations.
C’est là que la data science et les désormais incontournables data scientists ont toute leur importance. Véritables interprètes de la donnée, ils étudient l’ensemble des corrélations, combinaisons ou segmentations possibles pour mener rapidement à bien, via des solutions de type analytics ou dataviz et la création d’algorithmes, des analyses comportementales ou prédictives. Sans cet accompagnement, le Data Lake reste une coquille vide, sans aucune valeur ajoutée pour l’entreprise.
Le Data Lake apparaît désormais comme un incontournable mais il ne reste néanmoins qu’un maillon pour toutes entreprises souhaitant adresser toute la chaîne de valeur de la data !