Pourquoi recruter un Data Scientist? Quels profils recruter?

A l’ère de l’explosion des données, et alors que la bataille de la data a déjà commencé, de nombreux secteurs s’intéressent au profil de Data Scientist et cherchent à les recruter. Quels sont les enjeux sous-jacents d’un tel recrutement? Quel profil de Data Scientist recruter en fonction de son projet de data?

Le contexte: l’explosion du volume de données et l’ innovation dans le traitement des données

Le rythme de création de données est désormais exponentiel: durant les cinq dernières années nous avons créé autant de données que depuis le début de l’humanité. Ces données peuvent être liées aux images, aux vidéos, aux articles que nous écrivons, à nos habitudes de consommation ou de déplacement etc…. Nous les utilisons quotidiennement, et elles ont donc un impact dans toutes les industries.

De nouvelles technologies sont apparues comme Hadoop ou Spark qui permettent le stockage et le traitement d’immenses volumes de données. Ces technologies ont pour effet d’augmenter la vitesse et la capacité de traitement des données. Le machine learning par ailleurs permet d’automatiser l’interprétation de bases de données très larges, en mettant fin à notre incapacité à traiter toutes les données produites.

La Data Science a ainsi émergé et avec elle le profil de Data Scientist afin d’exploiter ces données. La data science offre la possibilité de stimuler la croissance des entreprises par l’utilisation et l’exploitation des données. Les projets de science des données créent des opportunités de création de valeur et peuvent ainsi générer d’importants retours sur investissements. Les réussites spectaculaires telles que Google, Facebook, Amazon tiennent principalement à une utilisation et une exploitation poussée des données et du Big Data.

Quelles sont les applications de la Data Science dans les différents secteurs aujourd’hui?

On voit aujourd’hui émerger de plus en plus de projets impliquant le big data et les data sciences. Ces projets sont liés à la valorisation des données ou à l’exploitation des techniques analytiques : que ce soit dans les ventes, dans le marketing, dans la lutte contre la fraude, dans la cyber-sécurité.

En marketing elles peuvent être utilisées pour optimiser les campagnes emailing ou les campagnes publicitaires ou pour segmenter sa base clients selon différents types d’indicateurs.

En finance, les Data Scientists créent des modèles d’évaluation et de prédiction pour améliorer la rentabilité des investissements

Dans le secteur des technologies de communication elles ont permis la création des Chatbots, utilisant des modèles de Machine Learning basés sur le Natural Language Processing (ou NLP).

Dans le secteur de la santé, les Data Sciences permettent de détecter des cancers avant qu’ils ne surviennent grâce à des modèles prédictifs.

Pour les sites e-commerce la collecte et d’analyse de données est devenue incontournable: statistiques de visites, de parcours, comportementales… La segmentation de la base client permet de contextualiser et de personnaliser les messages afin d’augmenter le taux de conversion des clients.

En startup, les premiers Data Scientists recrutés définissent généralement le processus d’acquisition de données et ont pour tâche d’ automatiser au maximum leur collecte. Le Data Scientist « nettoie » les données, les trie avant de les exploiter et de se livrer à des analyses. Le Data Scientist choisit également les outils avec lesquels il travaillera au quotidien. Si l’outil dont il a besoin n’existe pas sur le marché, il peut être amené à concevoir lui même et implémenter l’outil d’analyse de données.

Dans les startups « technologiques », le Data Scientist développe par exemple des algorithmes d’apprentissage par renforcement ou des programmes d’intelligence artificielle utilisés pour les robots et les drones notamment.

En quoi les data scientists sont-ils créateurs de valeur?

De manière générale, l’approche des data sciences peut s’appliquer à tout business model ou entreprise dans la mesure où toute entreprise produit et collecte des données au travers de son activité et au travers des interactions entre les employés et les clients de l’entreprise.

En se basant sur ses connaissances en sciences mathématiques, en statistiques et en informatique, le rôle du Data Analyst va être de valoriser l’ensemble des données détenues par les entreprises (base de données clients, chiffres de vente, historique des transactions, visites des internautes, comportements d’achat…). L’objectif est d’ extraire de la connaissance utile à l’optimisation des produits et services proposés pour mieux cibler les clients, proposer des produits plus adaptés, créer une nouvelle offre à partir des données collectées, identifier des opportunités de réaliser certaines économies.

Certaines entreprises choisissent de focaliser l’activité de leurs Data Scientists sur une thématique d’étude particulière ou une direction métier déterminée en fonction de leurs besoins et de leur stratégie : tarifs, marketing, relation client, audit qualité…

Les Data scientists au service de la prise décision

En facilitant la collecte , l’analyse et surtout la visualisation des données sous forme synthétique par le biais de tableaux de bords le Data Scientist simplifie également la prise de décision à tous les niveaux de l’entreprise. Ce travail permet de fonder les décisions et les choix sur des réalités concrètes et vérifiées et d’accroître leur pertinence en les alignant avec les objectifs de l’entreprise. Par exemple, si l’on sait quels types de clients vont acheter tels types de produits, il sera possible d’affiner les messages publicitaires et le discours marketing et de délivrer des messages en adéquation avec les attentes particulières de tel segment d’acheteurs potentiels.

Un Data Scientist peut donc exploiter et analyser un grand nombre de données informatiques pour en extraire des données chiffrées utiles à une entreprise mais il peut être également intervenir pour créer des algorithmes sur la modélisation des données qui aideront la prise de décision dans une entreprise.

Quels profils de Data Scientists recruter?

Le choix de recruter un seul Data Analyst ou une équipe complète de data science dépendra du projet et de la taille de l’entreprise.

Dans les grandes entreprises qui peuvent recruter plusieurs profils dédiés à la data, des profils différents correspondent généralement aux différentes étapes du traitement de la data :

-collecte des données

-fouille des données (data mining),

-gestion des données (data engineering, data management),

-analyse des données,

-visualisation des données (data visualization)…

Le « Data Scientist » a alors un profil spécialisé sur l’une de ces tâches, et est désigné par un terme plus précis : Data miner, Data manager, Data analyst

Idéalement une équipe de data science devrait être composée de profils complémentaires à trois niveaux distincts et déterminants:

-Un Data Engineer: en charge de la collecte des données, de leur extraction et de leur mise en forme afin de faciliter leur utilisation par la suite par l’ensemble des utilisateurs au sein de l’entreprise

– Un Data Scientist: responsable de l’analyse et de l exploration des données mais également de la modélisation des données. Son rôle est de construire des modèles pour faire « parler » les données et répondre ainsi aux question et aux problématiques posées par les directions métiers

-Un Machine Learning Engineer: sa tâche consiste à mettre le modèle en production en trouvant la bonne configuration pour les modèles et en tenant compte des contraintes en ressources de l’entreprise

Un manager Data Scientist ou un Chef de projet peuvent être nécessaires pour animer le travail de l’équipe et coordonner les interactions et la communication avec les différents services concernés.

Les petites entreprises, celles qui se sont plus récemment impliquées dans des projets de data science, recrutent généralement des Data Scientists plus polyvalents et généralistes, des profils « multi-spécialistes ». Ces profils devront traiter l’ensemble des étapes du projet de big data et doivent pouvoir travailler en toute autonomie.

Certaines entreprises de taille plus importante préfèrent cependant que le Data Scientist qui analyse les données réalise également leur nettoyage préalablement afin de garder une vision complète du projet et de la chaîne de gestion des données.

Il faut savoir que les métiers de la data science et du big data font partie des métiers les plus pénuriques aujourd’hui. Les recruteurs recherchent des profils expérimentés capables d’appréhender des problématiques complexes mais le métier est récent et il y a encore peu de formations, donc peu de profils sur le marché globalement.

Du fait de son développement sur de nombreux marchés , le métier est déjà en train de se spécialiser et de se segmenter.

Comme le marché est de plus en plus mature les profils tendent à se spécialiser sur ce qu’ils dominent le mieux et à monter en compétences dans un domaine ou un secteur particulier.

Ces spécialisations se font par exemple soit sur le plan de la technologie avec des spécialistes de la computer vision ou du NLP (Natural Language Processing), soit sur le plan des opérations, avec des professionnels du scraping ou du nettoyage de bases ou encore sur le plan de la finalité, avec des experts du pricing ou de la détection de fraude.

Qu’est ce qu’un bon data scientist?

Le métier de data scientist se trouve à la jonction entre des maths, de l’IT, du Machine Learning et des statistiques, le tout avec une forte orientation métier. C’est un profil hybride, une sorte de mouton à 5 pattes qui demeure difficile à trouver d’autant que la formation en France a tendance à privilégier les cursus plutôt spécialisés . Même si on voit émerger des formations dédiées et les premières promotions d’experts, ces profils restent encore rares.

Le socle incontournables de compétences pour un bon Data Scientist est le suivant:

-Une formation initiale de niveau Bac+5 en mathématiques et statistiques,

-Une bonne connaissance des outils informatiques d’analyse

-Une capacité d’analyse et de réflexion afin de comprendre les enjeux du client, sa problématique et ses objectifs.

Parmi les compétences techniques aujourd’hui recherchées pour les profils de Data Scientists on peut citer:

SQL : pour gérer les bases de données structurées
La statistique: pour savoir au minimum comment construire une moyenne, une médiane, un écart type etc.. et les outils statistiques de type SAS, SPSS.
Une connaissance des algorithmes statistiques et du Data Mining pour les profils plus expérimentés: régressions logistiques, analyses discriminantes, arbres de décision (CART, CHAID), méthodes de clustering (WARD, K-MEANS), forêts aléatoires
Les langages tels que R, Python: pour programmer et analyser les données
Le Machine learning: pour construire des modèles de prédictions sans avoir besoin de coder chaque étape de calcul
Les outils de Data Visualization tels que Tableau, Chartio, Periscope Data pour faire parler les chiffres de manière visuelle auprès d’une audience néophyte et rendre ainsi son travail accessible à tous
Le Data Mining : pour explorer différentes sources de données et à identifier celles qui sont utiles pour résoudre le problème posé. Des outils comme Google Analytics ou Optimizely et la base en Web Analytics sont nécessaires
Le Nettoyage de données avec Excel ou Python: afin de gérer les données manquantes et s’assurer que toutes les données sont du bon type
La connaissance des librairies principales de Data Science (Numpy, scipy, pandas, sklearn) est aujourd’hui généralement nécessaire
Les différents languages d’accès et de manipulation des données (HDFS, Spark, Scala, HQL, Pig etc…) sont également utiles

Au delà des compétences techniques les spécialistes du métier s’accordent sur le fait que le plus important est sans doute la capacité de réflexion, car plus que des compétences mathématiques ou des connaissances en modélisation ce qui importe est la capacité du Data Scientist à aller au delà des chiffres pour comprendre les problèmes posés. Il doit pouvoir se poser les bonnes questions sur ses données: quelle décision faut-il prendre pour engendrer une amélioration? Comment peut-on mesurer les améliorations? Quelles contraintes opérationnelles limitent notre action?

Enfin on peut ajouter les compétences en communication. Un bon Data Scientist doit pouvoir communiquer ses chiffres et ses analyses aux membres de son entreprise ne possédant pas de background analytique afin que ses analyses soient utilisables et exploitables par l’ensemble de l’entreprise.

Quelles sont les formations à privilégier pour les Data Scientists?

Les écoles Polytechnique, Télecom et Agro Paris Tech ainsi que l’INSA de Renne dispensent des Master II avec une formation théorique aux outils d’analyse. Les Grandes Ecoles d’ingénieur spécialisées en mathématique et statistique sont de bonnes formations pour se préparer au métier de Data Scientist : ENSAE, INSAI, INSA. Les cursus d’informatique ou de statistique appliquée, ou bien un master en mathématiques appliquées ou en data science sont également des voies possibles.

Dans un contexte de pénurie les profils issus du monde universitaire peuvent être également des candidats intéressants, car contrairement à l’image négative qu’en ont encore certains employeurs, les gens dans le milieu universitaire doivent très souvent travailler deux fois plus dur. Leurs budgets ou leurs subventions sont généralement insuffisants pour payer les outils dont ils ont besoin et ils sont donc poussés à se débrouiller par eux mêmes en développant leurs propres outils ce qui en fait des profils autonomes et débrouillards.

Conclusion:

Les Data Scientists sont au coeur de ce processus qui challenge de nombreux métiers et de nombreuses entreprises dans leur organisation interne et dans leur modèle relationnel vis à vis des clients. Les clients sont désormais en attente d’immédiateté et de personnalisation ce qui implique de bien comprendre le parcours de chaque client et donc de maîtriser les données les concernant. Même si les profils de data scientists sont difficiles à recruter il n’en demeure pas mois qu’ils jouent désormais un rôle crucial pour appréhender et traiter ces enjeux. Pour sécuriser son recrutement et raccourcir les temps d’embauche un cabinet de recrutement spécialisé est bien souvent nécessaire. Un cabinet de recrutement spécialisé sur les métiers de l’IT, du digital et le de la data sera en mesure d’apporter une aide décisive dans le sourcing et l’évaluation les profils recherchés.

Articles populaires

Articles en lien

Autres articles

Lancer un recrutement

 

Vous cherchez à renforcer votre équipe marketing ? Faites confiance à des spécialistes