Si vous vous posez la question de la mise en place d’une stratégie Big Data dans votre entreprise, il y a de grandes chances pour que l’une de vos préoccupations majeures soit le recrutement ou l’accès aux compétences spécialisées : data scientists, data managers, architectes et chefs de projet big data…

datascientist-france

En effet, si les profils qualifiés commencent à arriver sur le marché, l’accès à ces compétences et leur organisation en interne est souvent une question complexe face à laquelle les managers ne sont souvent pas équipés.

data-scientist-only-wp

A lire aussi – Devenir Data-Scientist : le guide des formations et des MOOCs Big Data

Notre dossier sur les formations présente les compétences du data scientist, les principales formations françaises dans le domaine des technologies Big data et des techniques Data Science, ainsi qu’un guide des MOOCs et des ressources pour démarer….lire l’article

Le Data Scientist : rôle, compétences, rémunération, recrutement

Une rapide recherche sur Linkedin permet d’estimer grossièrement le nombre de DataScientists en France à environ 3500. S’il est difficile d’estimer avec précision le besoin des entreprises, de nombreuses enquêtes soulignent la difficulté des dirigeants et des managers à recruter du talent analytique. Dans une étude EMC de 2014, plus de 2/3 des répondants estimaient que l’accès aux compétences spécialisées était le principal frein à l’amélioration data-driven.

Le rôle du Data Scientist dans l’organisation

Le Data Scientist est la pierre angulaire de l’amélioration Data Driven dans l’entreprise. Ses premières compétences sont quantitatives et techniques, mais il possède une compréhension de l’ensemble de la chaîne de valeur de la donnée:

  • Formalisation analytique du besoin métier
  • Identification et collecte des sources de données
  • Agrégation, nettoyage et enrichissement
  • Implémentation des algorithmes
  • Conception des applications ou des services pour les utilisateurs finaux

Il existe plusieurs schémas d’organisation en ce qui concerne le rôle du Data Scientist :

Organisation matricielle : placé au sein d’un département Data, il est amené à travailler sur des problématiques très différentes en fonction des besoins métier (text mining pour les RH, scoring de client pour le Marketing…). Généralement sous la direction d’un Chief Data Officer et entouré de compétences techniques (DSI) et de représentants des métiers, le rôle de la taskforce est aussi de mettre en place une démarche globale de gouvernance des données.

Rattaché à une Business Unit : dans cette configuration, le Data Scientist travaille à l’amélioration continue des activités du métier auquel il est rattaché. Ce schéma d’organisation est notamment pertinent au sein des grandes entreprises dont les problématiques et les opportunités Data sont concentrées dans un domaine : gestion du risque en Assurance, optimisation de la chaîne logistique en transports, acquisition et fidélisation en retail…

Rattaché à la DSI : dans certains cas, les profils Data Scientists peuvent être rattachés à la Direction des Systèmes d’Information, qui gère historiquement les infrastructures de collecte et de traitement des données, ainsi que le parc applicatif. Cette organisation permet de maximiser la cohérence des choix techniques mais peut se traduire par une déconnexion entre les besoins métiers initiaux et le livrable.

Compétences et Rémunération

En vertu de leur profil très spécialisé et de la forte demande sur le marché, les Data Scientists peuvent prétendre à des salaires supérieurs à 50k € dès la sortie de l’école – nivau Master. Aux Etats-Unis, pour les doctorants, ces salaires peuvent dépasser les 120 000 $.

Leurs compétences couvrent globalement 3 domaines :

  • Mathématiques / Statistiques
  • Technique / Informatique
  • Métier / Stratégie

 

Infographie EMC : les compétences du Data Scientist (cliquez pour élargir)

lightbox title
 

Comment recruter un Data Scientist ?

1. Les formations Ingénieur / Data Science

L’un des principaux canaux pour recruter des Data-Scientists consiste à se rapprocher des organismes de formation qui proposent des formations en Data Science. Encore très rares il y a deux ans, de plus en plus d’écoles lancent des programmes Big Data : le CNAM, l’INP Grenoble, Centrale et Polytechnique, l’EPITA, HEC, l’Essec et l’Ensae…
Bien sûr, ces formations ne sont pas toutes équivalentes, elles mettent souvent l’accent sur l’un des axes de compétences du Data Scientist (technique / informatique, mathématique / statistiques ou business / stratégie). Cependant, elles délivrent globalement des compétences de haut niveau et des profils suffisamment polyvalents pour répondre à une bonne partie des problématiques des entreprise.

Consultez la liste complète des formations ou contactez-nous pour des conseils personnalisés.

2. Les cabinets de recrutement spécialisés en data scientists

Encore peu nombreux en France, les cabinets de recrutement compétents sur les profils spécialisés Data Science sont de bons moyens de gagner du temps, même s’ils représentent souvent un investissement financier non négligeable. Leur principale valeur ajoutée est de vous aider à définir plus précisément votre besoin pour garantir l’adéquation du profil avec vos objectifs.

Quelques cabinets spécialisés : BlueSearch Conseil, Uman Partners, Clémentine Recrutement

3. Les data scientists « à la demande »

Une alternative au recrutement de Data Scientists consiste à faire appel à des cabinets de conseil en Data Science ou des entreprises spécialisées dans l’outsourcing de compétences Data Science.
La logique derrière ce type de démarche est triple :

  • D’une part, étant donné que le recrutement de Data Scientist est un investissement significatif, et il peut être intéressant de démarrer sous forme d’expérimentation en faisant appel à des compétences spécifiques de manière ponctuelle, afin de valider une opportunité sur un périmètre défini.
  • Ensuite, vu la rapidité de l’évolution des outils et des technologies et les spécifités propres à chaque projet, il est irréaliste de considérer qu’un Data Scientist pourra répondre adéquatement à l’ensemble des problématiques Data d’une entreprise.
  • Enfin, beaucoup d’entreprises n’ont aujourd’hui pas la maturité ou la dimension pour rentabiliser un Data Scientist à plein temps. Le recours à des ressources externes permet alors de dégager des améliorations rapides sans engager de coûts excessifs.

Quelques cabinets de Data-Scientists français : Quantmetry, Bluestone

Les autres métiers du Big Data

Data Manager ou Chef de Projet Big Data

Un chiffre passe souvent un peu inaperçu dans l’étude de McKinsey qui a lancé la course aux Data Scientist. En plus de la pénurie de profils quantitatifs, McKinsey souligne que les entreprises vont devoir recruter (ou former en interne) des managers possédant une compréhension approfondie des des enjeux business et des techniques relatives à l’analyse de données.

Le rôle du Data Manager est central dans la transformation Big Data de l’entreprise :

  • Il comprend les enjeux stratégiques et les opportunités concrètes du Big Data en entreprise et se positionne comme force de proposition dans la mise en place de projets Data Driven
  • Il connaît l’écosystème et le marché des fournisseurs de solutions Big Data (offre, positionnement…), ce qui lui permet d’être plus pertinent dans sa démarche projet et dans l’implication de fournisseurs externes
  • Il possède une forte sensibilité aux problématiques technologiques et maitrise les bases de la Data Science, qui lui permettent d’encadrer une équipe projet et de faire collaborer des compétences diverses dans la réalisation d’un objectif commun

Compétences : Gestion de projet, gestion d’équipe, connaissance métier, connaissance des enjeux et de l’écosystème Big Data, maîtrise des
Rôle : moteur la transformation Big Data de l’entreprise, impliqué opérationnellement dans la conduite de projets et garant du respect des objectifs métiers

Chief Data Officer

Le Chief Data Officer est généralement un profil issu d’une ligne métier, expérimenté dans le pilotage de programme et la gestion d’équipe à haut niveau. Il doit posséder une bonne connaissance technique de la donnée et une vision stratégique des possibilités de création de valeur pour le business par les techniques analytiques.
Son rôle est large :

  • Etre force de proposition et sponsor auprès du Top Management pour la mise en place d’améliorations Data-Driven
  • Piloter la transformation de l’entreprise grâce à une stratégie globale de valorisation des Data
  • Avoir une approche de veille proactive et garantir le respect des contraintes liées au traitement de la donnée (sécurité, réglementaire…)
  • Récompenser les usages qui améliorent la performance diffuser une culture de la donnée
  • Architectes Big Data

    Les Big Data imposent au Système d’Information un rythme dévolution bien plus rapide qu’avant. Les trois « V » originaux des Big Data imposent des changements dans la gestion des systèmes, et c’est ce qui différenciera l’Architecte Big Data de l’Architecte SI « classique ». Toute les entreprises n’ont pas besoin d’un architecte Big Data : il faut générer des To de donneés par semaine pour qu’il soit indispensable. Se posera alors à lui les questions de la gestion de ces quantités d’information, et la prise en compte des conséquences en terme de choix technoologiques, de maintenance et d’évolution du systèmes. Hadoop par exemple, fonctionne différemment s’il est installé sur une machine, sur un Rack ou sur plusieurs Rack. Les quantités de mémoires disponibles par machines jouent aussi un rôle important. Or la mémoire coûte cher, il faudra donc optimiser les coûts en achat matériel, gérer les fournisseurs et être au courant des dernières versions logicielles pour optimiser l’usage de cluster ayant plusieurs dizaines voir centaines de machines ! C’est le rôle de l’architecte Big Data.

    Développeurs Big Data

    Le développeur, lui s’appuiera sur les outils mis à disposition par l’architecte pour créer les services nécessaires à l’entreprise. Il a pour cela deux armes principales à sa disposition :
    1) les fonctionnalités proposées par les outils et les langages : les connaître et être familliers avec certains langages (Java, Pig, Hive…) et modes de pensées (map-reduce) distingue le développeur Big Data de ceux qui n’ont pas à gérer de tels quantités d’informations
    2) l’algorithmie tel que le machine learning : l’algorithmie est le coeur même de l’informatique, et elle permet des gains substentiels pour qui sait s’en servir correctement. Si la loi de Moore fait doubler la puissance de calcul des ordinateurs tous les deux ans, l’algorithmie, elle, peut diviser vos temps de traitements par 1000 en cinq minutes ! Construire un algorithme efficace est indispensable quand on gère des programmes où le temps d’éxécution est clef, soit pour le temps réel, soit en mode batch au vue des quantités de données à traiter.

    Data Visualizer

    Tout l’enjeu des Big Data est un enjeu de taux de transfert des informations : transfert entre les disques et le microprocesseur, transfert entre l’ordinateur et l’humain. Si le premier est géré par Hadoop et l’éco-système temps réel, le second est résolu grâce à l’oeil dont le débit est d’environ 100 Mb/s (soit la lecture d’un DVD en 6 secondes). L’oeil est un outil extrémement puissant, et la datavisualisation est là pour s’en servir. Ainsi le Data-Vizualiser a-t-il pour objectif de présenter l’information de la manière la plus efficace possible pour la transformer à l’humain dans un temps minimal. Les outils de contextualisation, de comparaison, de zoom en « drill-down », d’annotation, de détail, de manipulation, de changement de perspective, etc… sont indispensables à un usage réfléchi de la data, et c’est au Data Visualizer de les mettre en place, par la création d’interfaces sur mesure qui passent par la compréhension des problématiques métiers, des enjeux business et des données disponibles.

    Votre entreprise s’intéresse au Big Data ? Vous cherchez à recruter un Data Scientist ?

    Partagez l’article

     

    Inscrivez-vous à la Newsletter Data-Business.fr