Data Analyst et Data Scientist : quelles différences existent entre ces deux métiers ?

Data Analyst et Data Scientist : quelles différences existent entre ces deux métiers ?

Il est parfois compliqué de faire la différence entre un Data Scientist et un Data Analyst et pourtant ce sont bien deux métiers distincts.

Pour vous aider à comprendre la distinction, je vous propose un récapitulatif de 4 points qui rapprochent ou différencient le Data Analyst et le Data Scientist : les compétences nécessaires, les outils utilisés quotidiennement, les missions qui leurs sont attribués et enfin les projets sur lesquels ils sont amenés à travailler. ⚡


Pour encore plus d'informations, vous pouvez également retrouver à la fin de cet article le lien d'un webinaire réalisé par Valentin, le fondateur d'Esteka-data, dans lequel il accueille un Data Scientist et un Data Analyst pour, justement, répondre à ces questions. ⬇️


Les compétences 🎓


La première question que l'on se pose concerne les compétences nécessaires pour exercer d’un côté le métier de Data Scientist et de l’autre celui de Data Analyst.


Plusieurs points reviennent dans les deux cas, le premier concerne la curiosité et l’apprentissage continu. Et oui ! La technologie évolue en permanence et assez rapidement. Il est important de s’intéresser aux nouvelles méthodes et de les intégrer continuellement dans le métier.

Le second concerne le sens de l’écoute et du partage car le travail n’est pas fait pour soi mais avant tout pour un client. Il est nécessaire de comprendre la demande et de vulgariser les informations afin qu’elles soient le plus compréhensibles possible.

La différence se fait surtout sur l’aspect technique puisque, contrairement au Data Analyst, le Data Scientist est amené à beaucoup travailler avec le Machine Learning et donc des mathématiques assez poussées.


Vous commencez à y voir plus clair ? 🤓 Les parties suivantes devraient vous aider à mieux comprendre concrètement les outils et les missions de chacun.


Les outils 🔧


De nombreux outils sont communs aux deux métiers. Codant en R et en Python qui sont des langages de programmation, le Data Scientist et le Data Analyst utilisent tous deux Jupyter qui offre un environnement de développement interactif pour le code Python et notamment le Machine Learning. Ils utilisent également le logiciel RStudio qui est plus intuitif pour les statistiques.

Les deux utilisent également Excel pour faire des recherches rapides et PowerPoint pour les rapports et les présentations des résultats.

Les différences se trouvent dans les librairies utilisées, le Data Scientist, qui fait du Machine Learning utilisent principalement les librairies “tensorflow” et “scikit-learn” en Python. Le Data Analyst lui utilise plus souvent les librairies de base à savoir “pandas” ou encore “numpy”. Ce sont des éléments sûrement un peu technique si vous ne faites pas de la data, retenez juste que les outils sont similaires pour les deux métiers mais avec quelques distinctions.

Enfin, le Data Analyst utilise des outils supplémentaires comme PowerBI ou Tableau Software pour la réalisation de tableaux de bord.


À nouveau, il n’y a pas énormément de différences entre les deux métiers au niveau des outils de manière générale. Vous verrez que les missions, par contre, sont assez différentes ! 🎯


Les missions 📋


Si on devait résumer les missions du Data Analyst, ce serait de la manière suivante :

  • Récupération
  • Nettoyage
  • Valorisation
  • Vulgarisation


Il s’agit de récupérer les données si cela n’est pas encore fait, de procéder au nettoyage qui n’est, certes, pas la partie la plus fun mais pourtant la plus importante du travail. ❗

Cela passe ensuite par de la recherche de valeur dans les données, on cherche à expliquer le passé pour en déduire éventuellement le futur ou prendre des décisions.

Enfin, les informations et les résultats sont vulgarisés afin de les rendre les plus compréhensibles possible par le métier.

Même si le Data Scientist est amené à réaliser ces missions, il réalise également des analyses prédictives et met en place des outils d’aide à la décision.


Jusqu’à maintenant, les différences n’étaient pas très flagrantes entre les métiers et je peux comprendre la confusion. Je pense que les exemples de projets qu'ont été amené à effectuer les invités vous permettront d’y voir plus clair. ✍🏻


Les projets 💻


Exemple de projets réalisés par un Data Scientist :

  • Nettoyage et gestion de bases de données
  • Moteur de recommandations
  • Moteur de prédictions
  • Segmentation des clients pour prédire les comportements d’achat
  • Mettre automatiquement des tags sur des questions posées sur une plateforme
  • Moteur de reconnaissance de races de chiens


Exemple de projets réalisés par un Data Analyst :

  • Création de rapports mensuels
  • Création de bases de données et exploitation
  • Réalisation d’une étude sur la sous-nutrition dans le monde
  • Automatisation des données d’une boutique (vérification de la cohérence des prix avec ceux de la concurrence)
  • Catégorisation des clients
  • Réalisation de tableau de bord sur l’accès à l’eau potable dans le monde
  • Détection de biais


J’espère que ce récap vous permet d’y voir plus clair et que vous saurez maintenant faire la distinction entre les missions d’un Data Analyst et celles d’un Data Scientist.

Je le disais plus haut, voici le replay d'un webinaire que nous avons réalisé sur le sujet ⬇️: