Le métier de Data Scientist

#Data Family

Data Scientist

Le métier de Data Scientist fait partie de la grande famille de la Data Science. On retrouve ce terme pour la première fois en 1960. Depuis 15 ans, le nombre de recherches Google dans le monde sur le sujet a été multiplié par 10. (À ce niveau là on est plus sur une tendance mais sur une transformation 🤯)

Commençons par différencier le Data Scientist du Data Analyst, ces métiers sont cousins mais n’ont ni les mêmes missions, ni les mêmes connaissances.

Le Data Scientist évolue dans le big data et manipule des tonnes de données numériques. Il crée les fameux algorithmes et se débrouille très très bien niveau langage IT (surtout en 🐍). Le métier est clairement technique! 

Le Data analyst se sert des mêmes données mais sur un périmètre beaucoup plus restreint et bien souvent déjà délimité. Ils répondent souvent  à des problématiques d’ordre commercial ou marketing. Également ils auront plus de difficulté à construire de nouveaux modèles de données et ils travaillent l’existant.

Pas étonnant, en 2020, pour les entreprises la data c’est la vie !

De l’e-commerce au service en passant par l’industrie, les entreprises de tous secteurs confondus collectent de plus en plus de données. Plus on connaît ses clients, meilleure sera l’offre de valeur qu’on leur propose. Il est cependant très compliqué de dégager une définition générique sur n’importe quel métier de la data, pour deux raisons :

Dans l’IT par exemple il y a 15 ans on était informaticien, il y a 5 ans développeur, et aujourd’hui ces termes manquent cruellement de précision. On est développeur back end, front, full stack, python… Aujourd’hui on est Data Scientist, demain on sera bien plus spécialisé que cela (j’en parle plus bas 👇)

En trois étapes : Il cherche des modèles de données intéressantes, il construit un modèle de datas (et là c’est technique!), et ensuite soit il passe la main à des datas analysées soit il trie et analyse lui-même les données récoltées pour orienter les prises de décisions “data driven” et les améliorations sur les produits et ou services.

Si on rentre un peu plus dans le détail ses missions sont :

Étape 1 : Chercher et construire

  • Travailler la donnée (structurée et non-structurée, disponible dans le lac de données) 
  • Développer des produits Data Science afin de répondre aux enjeux de la société (ingestion des données, modélisation puis activation) 
  • Travailler sur des projets dans différents domaines en développant des modèles statistiques (Machine/Deep learning) pour les rendre opérationnels.
  • Accompagner la mise en production des produits Data Science, améliorer si besoin les performances des algorithmes existants.

Conclusion: Première chose donc, comme partout il faut chercher pour trouver. En fonction de la clarté du besoin de l’entreprise, du secteur d’activité de la donnée disponible cette étape sera plus ou moins longue.

Étape 2 : Corriger et Tester

  • Restreindre le périmètre de données 
  • Trier les données et écarter celles qui sont le moins pertinentes
  • Réajuster le modèle 
  • Réaliser l’AB/Testing

Comme son nom l’indique le BIG DATA est grand, donc pour être de plus en précis il va falloir corriger 

Étape 3 : Analyser et maintenir

  • Restituer les résultats (rapports, présentations…) 
  • Industrialiser le modèle, le maintenir et l’enrichir en fonction des évolutions (internes et externes) et des besoins

Pour faire tout ça dans ta boîte à outils tu dois avoir : (pas mal de choses)

  • La connaissance d’environnements d’ensembles de données importants, des bases de données relationnelles (SQL, MySQL, PostgreSQL, SAP HANA, Mongo DB. Microsoft SQL Server) et expérience dans un environnement Cloud (ex : AWS) ;
  • En visualisation de données (Tableau, Spotfire, TIBCO, R Shiny ou autres librairies Python) ;
  • De logiciels et de langage statistiques type R, Python, SAS, PSPSS, RapidMiner, 
  • Des techniques statistiques et de l’exploration de données ;

Niveau 💸💸💸

Le salaire du Data Scientist se situe à minima entre 50 et 60 K€.

Selon l’entreprise, le secteur d’activité et l’importance des données, le salaire du Data Analyst peut être plus important.

Le métier et son avenir:

Aujourd’hui le Data Scientist peut évoluer vers plusieurs postes et fonctions. Type Head of data, Master Data Manager. Comme évoqué plus haut, le métier va certainement se spécialiser et nous allons voir de nouveaux métiers apparaître comme, le métier de data quality manager (aujourd’hui une grosse partie du boulot pour le data scientist c’est le tri de data), Data designer (qui conçoit le système de données) qui sera une spécialisation de la première mission du Data Scientist , Data meaning manager (qui aura pour responsabilité de vulgariser la data) sans parler des nouveaux métiers liés à l’IA…