Top 3 des termes de Data Science à connaître 🧠
Dans le domaine de la Data Science, nous sommes amenés à communiquer avec de nombreux interlocuteurs différents. Lorsque l’on parle avec des personnes externes au domaine, nous tâchons d’employer le moins de termes techniques possible. Malheureusement, il nous arrive de glisser quelques mots de notre jargon dans la conversation.
Afin qu’à l’avenir vous compreniez plus concrètement de quoi il s’agit, je vous propose une traduction de 3 termes que nous utilisons régulièrement en Data Science ⭐.
Big Data 💥
Vous en avez forcément déjà entendu parler, mais qu’est-ce que le Big Data ?
Je ne vous apprends rien si je vous dis que “Big” et “Data” sont des termes anglais se traduisant respectivement par “gros” (ou “grand”) et “données” 🤔.
Avec l’essor des nouvelles technologies et des réseaux sociaux, la production de données de toutes sortes (texte, vidéo, photo etc.) a explosé pour atteindre des volumes jamais atteints, on parle de données massives et donc de Big Data.
Le terme de Big Data répond à la règle des 3V : volume, vélocité et variété.
En effet, le Big Data ne représente pas seulement des données volumineuses mais aussi la variété des sources dont elles proviennent ainsi que la vitesse à laquelle elle circule 🚄.
Python 🐍
Un autre terme que vous risquez d’entendre régulièrement c’est “Python”. Et non il ne s’agit pas d’une espèce de serpent…en tout cas pas seulement !
D’un point de vue technique, il s’agit d’un langage de programmation comme peuvent l’être Java, PHP ou encore C++ à la différence que Python n’est pas très utilisé par les développeurs mais plutôt par les métiers de la Data.
Il est très utilisé pour analyser les données, pour créer des tableaux de bord mais aussi pour faire du Machine Learning (pas de panique, je vous explique juste en dessous de quoi il s’agit 😇).
Machine Learning (ou Deep Learning) 🧠
C’est une définition 2 en 1 que je vous propose ici ! 🤩
Si on traduit littéralement “Machine Learning”, on obtient “apprentissage machine” ou autrement dit “apprentissage automatique”.
Le Machine Learning est en fait une branche de l’intelligence artificielle, c’est une technologie permettant aux machines d’apprendre seules, sans avoir un programme tout prêt en amont 🦾.
Cette notion est directement liée au Big Data (vous savez de quoi il s’agit maintenant !). Pour apprendre seule, la machine a besoin de s’entraîner et pour s’entraîner elle a besoin de suffisamment de données. Plus le volume de données est important, mieux la machine apprend.
En pratique, le Machine Learning permet, par exemple, de faire des prédictions (prédire le nombre de cas d’une maladie, prédire le chiffre d’affaires d’une entreprise etc.), de la classification ou encore de la détection d’anomalie 👽.
Le Deep Learning, c’est à peu près pareil, en beaucoup plus poussé, on parle d’apprentissage profond, de réseaux de neurones (par comparaison au cerveau). En pratique cette fois, le Deep Learning permet de faire de la reconnaissance d’images (détecter la race d’un chien par exemple 🐶), de sons 🔊 ou même de créer de nouvelles images.
J’espère que ces explications vous ont plu et vous seront utiles ! 💡
Chez Esteka-data, nous souhaitons "montrer que le monde de la data est accessible à tous, en tout cas dans sa compréhension, c’est d’ailleurs tout l’intérêt de nos articles !
Pour aller encore plus loin dans la Data Science, je vous propose de lire notre article sur 5 exemples concrets d'utilisation des données en 👉cliquant ici. 👈