Les métiers de la data
Les métiers de la donnée sont de plus en plus nombreux. Les entreprises de tous les secteurs cherchent à exploiter les données à leur disposition pour aiguiller leur stratégie et leur développement.
C'est en discutant avec un client que j'ai eu l'idée de ce article. Ce n'est pas un secret , e monde de la data a connu une révolution au cours des dix dernières années. Je pense que le principal effet pervers du développement rapide du secteur est qu'un même métier est compris et perçu différemment selon les entreprises.
L'exemple typique est le métier de "data scientist", qui pour certaines entreprises est un statisticien, alors que pour d'autres, c'est un touche-à-tout de la donnée.
Pour palier à "ce problème", je vous propose un petit tour d'horizon de quelques métier de la données.
Architecte des données
On commencer par l'architecte des données. Il intervient en amont du traitement des données pour organiser la collecte et la gestion des données brutes, plus ou moins structurées, en plus ou moins grande quantité et provenant de sources diverses (internes, externes).
Après l'inventaire des données, il définit et optimise les infrastructures de collecte, de stockage et de traitement et les flux associés.
Il propose des évolutions de modélisation pour répondre aux enjeux de l'entreprise et faciliter le croisement des données.
L'architecte peut être amené à travailler sur le dictionnaire de données, la conception du MCD (Modèle Conceptuel de Données) ou l'inventaire des référentiels existants.
Vous vous en doutez, dans un contexte d'architecture Cloud, de temps réel et de cybersécurité et de contraintes réglementaires, l'architecte des données devient de plus en plus un rôle clé de l'entreprise.
Ingénieur data
L'ingénieur de données développe l'infrastructure définie avec l'architecte de données et se charge de construire des solutions techniques tout en assurant la maintenance et les évolutions.
Il réalise également l'intégration des données provenant de sources multiples. Il se charge également de vérifier la qualité de ces données. En production, l'ingénieur data assure le suivi et la surveillance des flux de données.
Data consultant
Le consultant en données travaille généralement sur un type de données spécifique provenant d'une source unique et connue, qu'il analyse avec une perspective "métier" afin d'orienter la prise de décision stratégique. Tour à tour en contact avec des data scientists et des experts métiers, il définit des indicateurs clés de performance afin de vulgariser et présenter ses résultats aux décideurs dans un format exploitable.
Data scientist
Sans doute le métier qui revient le plus souvent dans les articles lorsque l'on parle d'analysé de données. Le data scientist traite et analyse les données dans le but de définir une stratégie marketing, commerciale, ou pour donner des pistes d'amélioration de la performance et de la rentabilité, prévisions….
Le data scientist doit avoir une solide connaissance des outils mathématiques, statistiques et informatiques. Il sait coder, produire des méthodes (automatisées, autant que possible) et analyse de donnéeplus ou moins complexes. Il doit savoir également construire des algorithmes "intelligents" afin d'extraire des informations utiles.
Consultant data visualisation
Il est capable d'exploiter les données de l'entreprise, de les contextualiser et de proposer des visualisations simples pour en explorer le sens .
Grâce à un choix judicieux de graphiques et de relations entre les données, cet expert en data visualisation met en scène des données complexes, les rendant "lisibles" et accessibles afin de les présenter à des acteurs sans expertise technique.
DataOps engineer
L'ingénieur DataOps orchestre l'analyse des données en production et automatise la qualité, toujours en collaboration avec l'ingénieur des données.
Il doit s'assurer que les systèmes en production sont disponibles et performants. L'ingénieur DataOps a également un rôle de conseil en faisant la promotion des meilleures pratiques et des outils auprès des équipes de science des données pour améliorer la productivité et, surtout, éviter les erreurs courantes.
Data steward
Le data steward doit s'assurer que les données sont pertinentes, conformes, cohérentes et comprises. Pour cela, il définit les indicateurs de qualité.
Le data steward est un poste de direction, responsable de la qualité et de la sécurité d'un ensemble de données.
C'est l'équivalent d'un directeur financier pour les données financières.