C’est LE métier à la mode dans le monde du digital : le data scientist ! Ce nouveau profil accompagne la transformation digitale des sociétés mais soulève notamment des problématiques de gestion des ressources humaines… Retour en détails sur ces stars du digital que les entreprises vont s’arracher dans les années à venir.

Définition du métier de data scientist

Le data scientist est un profil capable d’analyser, d’exploiter et de croiser toutes les données de l’entreprise. Souvent recruté par des sociétés importantes, il doit traiter un volume important de données, appelé communément Big Data (résumé avec les trois V : Volume, Vélocité et Variété).

Mais la vraie valeur ajoutée de ces profils est leur capacité à transformer ces données en opportunités business pour les marketeurs. Faire parler les données, oui, mais toujours dans une logique « ROIste »…

La formation du data scientist

En France, on estime aujourd’hui les besoins à 2 000 à 3 000 postes de data scientist par an.

Seulement, 300 data scientists sont formés chaque année en France… Un écart assez important qui explique les salaires importants auxquels peuvent prétendre ces spécialistes du traitement de la data (voir ci-dessous).

Aujourd’hui, ces profils peuvent être issus de cursus assez variés comme la physique (quantique ou théorique), les statistiques, les mathématiques ou encore l’informatique. Mais des formations spécifiques sont maintenant disponibles. Deux grandes voies émergent pour se former à ce métier :

- intégrer une grande école qui propose un programme dédié à l’analyse de la Data. Voici quelques exemples :

Formation data scientist ECP

L’ECP propose désormais sa formation en data science

- obtenir un certificat avec des formations courtes dispensées en ligne. Notamment les MOOC (Massive Online Open Courses) proposées par les grandes universités américaines. Voici 2 exemples  :

Les compétences du data scientist

Les spécialistes de la data doivent avant tout être familier avec les technologies du Big Data. Ces outils ont été crées pour donner accès à la visualisation et au traitement de bases de données gigantesques.
Les principales technologies auxquelles sera confronté le data scientist sont les suivantes :

- Les bases de données NoSQL (Not Only SQL): Ces bases (orientées clé -> valeur, document, colonne ou graphe) qui sortent du modèle relationnelle des bases de données SQL, sont plus performantes en terme de stockage et de rapidité d’exploitation. Voici deux exemples de système de gestion de bases en open source : MongoDB (orienté document) ou Redis (orienté clé -> valeur).

- Les infrastructures de serveurs pour les traitements : l’outil le plus connu est le framework open source écrit en Java « Hadoop ». Pour faire (très) simple, il distribue les traitements sur des milliers de noeuds avec le principe des grilles de calcul. Pour une définition plus précise de ce framework géré par Apache, c’est ici.

- Les logiciels statistiques comme SAS ou R

Enfin, le data scientist doit être un expert de son domaine d’activité. Car c’est en comprenant parfaitement le métier dans lequel il évolue qu’il pourra orienter de manière pertinente le processus d’exploitation des données.

Et il gagne combien le data scientist ?

Souvent aidé par des cabinets de conseil spécialisés, les entreprises définiront tout d’abord s’il est judicieux ou non de créer des data labs.

Si la décision est prise de recruter un data scientist, il faudra compter pour un junior entre 40 000 € et 45 000 € de salaire annuel fixe.

Véritable casse-tête pour les ressources humaines des entreprises, le recrutement d’un data scientist n’est pas une chose aisée. C’est la raison pour laquelle Quantmetry, cabinet de conseil «pure player» en Data Science et en Big Data, a décidé de créer Datajob, un salon qui réunit « les entreprises en quête de leurs perles rares et les Data Scientists candidats ».

Pour conclure, une petite vidéo

Pour conclure, une petite discussion intéressante traitant de ce sujet :

Source : http://www.data-business.frhttp://www.pointsdevente.fr

Share Button