Passer

 » Il faut avoir le sens de l’équipe, car on ne travaille jamais tout seul quand on est Data Engineer « 

 

Capture d’écran 2021-11-02 à 12.41.12

 

 

Focus sur le métier de Data Engineer avec Florian Vandini, un rôle où les compétences techniques sont clés, mais ne font pas tout. Les savoir-être sont tout aussi essentiels, nous explique-t-il, sur les projets comme au sein de l’équipe pour monter collectivement en compétence. Plongée dans le quotidien d’un Data Engineer, et chez Ysance.

  

 

Florian, peux-tu te présenter en quelques mots ? Qu’est-ce qui te passionne dans ton job ?

 

J’ai suivi un cursus d’ingénieur en informatique avec la spécialisation « Systèmes d’information en entreprise » avec une option Business Intelligence. Aujourd’hui je suis chez Ysance depuis 4 ans où j’ai commencé en tant que Data Analyst, en alternance. J’intervenais plutôt en Data visualisation, en bout de chaîne, une fois les données préparées. Mon rôle était de les restituer du mieux possible et de les rendre intelligibles via la création de dashboards.

Au fil de mes expériences et de ma curiosité, j’ai commencé à élargir mon champ de compétences autour de la donnée. C’est là que j’ai commencé à faire du Data engineering. J’ai conservé ma fibre Dataviz, j’y consacre à peu près encore 20% de mon temps, mais le Data engineering est aujourd’hui au cœur de ce que je fais au quotidien : du montage de pipeline et de la conception de plateforme en particulier.

 

Ce qui me passionne c’est de découvrir des choses nouvelles et de trouver les meilleures solutions aux problèmes qui me sont posés. Il y a des millions de moyens et l’idée est de trouver celui qui est le plus efficient.


Quel est le profil type du Data Engineer chez Ysance ? Quelles qualités requises ?

 

Du côté des savoir-être, il faut avoir le sens de l’équipe, car on ne travaille jamais tout seul quand on est Data Engineer. Il faut voir la donnée dans sa globalité, c’est une chaîne de collaboration. Notre objectif à nous Data Engineer, c’est de la « nettoyer » et de la restituer de manière adaptée. Pour cela il ne faut pas rester dans son coin, être ouvert, aller voir les équipes. S’il y a des points de blocage, il faut savoir le dire. Être aussi force de proposition, ne pas hésiter à se lancer.

 

En termes de compétences techniques, on se doit de maîtriser principalement les langages SQL et Python. Les entreprises veulent aller vers le Cloud, ce qui implique de grandes bases de données essentiellement en SQL, c’est une compétence clé. Et puis Python, le langage pour travailler avec les données par excellence. Il permet notamment de faire de la modélisation. Enfin, il faut connaître les plateformes Cloud. GCP (Google Cloud Platform), AWS (Amazon Web Services) ou Azure (Mircrosoft) sont incontournables même si on peut démarrer sans tout maîtriser dès le départ. Pour ma part je suis certifié GCP par exemple.

 

À quelles problématiques clients répond-il le plus souvent ?

 

Il y a deux enjeux principaux pour lesquels nos clients nous sollicitent. S’ils ont déjà un dispositif existant, on premise par exemple (installé sur les serveurs de l’entreprise) ou via un Cloud provider qu’ils souhaitent changer. On adapte donc sa « configuration » pour qu’elle fonctionne de manière optimale. Ça peut répondre à une problématique de coût, à un manque de scalabilité ou à une maintenance trop lourde. Le Cloud répond bien au besoin dans ces trois cas. 

 

Autre problématique, le client ne dispose pas de base de données numérisée et souhaite en constituer une. Typiquement, j’ai rencontré des cas où le client ne disposait que de données brutes, traitées « à l’ancienne » via des envois de fichiers Excel par mail. La nécessité de centraliser, de mettre en cohérence et d’uniformiser était donc leur besoin principal. Là, il s’agit de tout développer depuis zéro et de proposer un dispositif complet.


Comment travailles-tu au sein de l’équipe ?

 

À mes débuts chez Ysance j’ai immédiatement travaillé à la conception d’une offre packagée, de manière très autonome. Ça m’a permis d’avoir d’emblée certaines responsabilités et beaucoup de liberté. J’ai pu proposer des choses et me « faire la main » de manière intéressante. J’ai ensuite intégré des équipes plus larges où j’ai eu l’occasion de faire valoir mon expérience auprès de collaborateurs plus juniors. J’aime beaucoup accompagner les gens, organiser des ateliers, challenger les propositions. Je deviens de plus en plus accompagnateur. Ça permet d’avancer en collectif et d’évoluer ensemble.

 

Je fais également partie de la Guilde Data Engineer et je peux être sollicité sur des questions précises sur des thématiques liées à Google Cloud Platform ou sur des points techniques par exemple. Je co-anime aussi régulièrement des webinars autour de nos offres, j’y fais des démonstrations. Notamment sur des dashboards qui permettent de visualiser la donnée d’entrée que l’on a « raffinée », et j’explique un certain nombre de points techniques sur notre approche. Enfin au sein d’Ysance, on propose des sessions d’accompagnement une fois par semaine pour nos collaborateurs en cours de certification. Je leur apporte mes connaissances et mes conseils pour réussir l’examen.

 

Quels sont les défis du Data Engineer aujourd’hui pour être à la pointe ?

Il ne faut pas avoir peur d’aller chercher, d’aller fouiller, et même de croiser les services de différents « cloud provider ». On peut faire des choses incroyables si on n’a pas peur d’explorer toutes les possibilités des outils. Puiser dans ses projets personnels aussi, du quotidien. Certains modèles de Google permettent par exemple de retranscrire l’audio en texte. Si on a la curiosité pour ce type de processus, on peut en faire des choses très intéressantes. J’ai utilisé ce service pour aider ma copine à retranscrire en un clin d’œil 6 heures d’enregistrement de ses réunions de travail. Hyper pratique. Et si un client me demande d’analyser des conversations et de créer un modèle pour reconnaître des mots, eh bien je sais déjà faire.

 

Côté clients, le graal c’est le temps réel. Dans le retail typiquement, recevoir les données immédiatement lorsqu’un client passe à la caisse automatique, c’est un idéal. Mais c’est très compliqué à mettre en place, et ce n’était même pas possible il y a encore quelques années. Il faut une grande puissance de calcul pour ce faire. On l’a déjà fait, mais ce sont de très gros chantiers. Il ne faut pas avoir peur de se lancer et d’expérimenter des choses. L’intérêt du Cloud c’est que l’on a énormément de capacité de calcul à disposition. Peu importe l’ordinateur dont on dispose, il suffit d’une connexion internet pour traiter des pétaoctets de données en quelques minutes.

Envie de rejoindre la team Ysance ?

{{cta(‘e038e766-a9f7-4f31-97b4-4a5eeeb18641’)}}

 

Vous souhaitez en savoir plus ?

{{cta(’75c19cbf-9575-4604-8ca3-ebb91649dbff’)}}