Cet article présente une étude plus détaillée des annonces par le biais de l’analyse des correspondances textuelles pour faire ressortir les similarités et différences entre les métiers.

Grâce aux informations recueillies dans nos données, nous allons pouvoir dresser une liste de compétences techniques et de qualités humaines associées aux différents métiers que nous étudions. Pour ce faire nous utilisons un graphique radar, également appelé graphique araignée est utilisé pour visualiser les valeurs ou scores attribués à un individu sur plusieurs variables quantitatives, où chaque variable correspond à un axe spécifique.
Les compétences techniques que doit avoir un data analyst sont le reporting, la visualtion des données et moyennement les statistiques. Il doit être dynamique, curieux, oragnisé, autonome, rigoureux et avoir le sens du relationnel et un esprit de synthèse.
Les data engineer doivent généralement avoir des connaissances concernant les technologies du Big Data, du cloud computing. Il doit être motivé, oragnisé mais doit aussi savoir travailler en équipe.
Quant au data scientist, il doit avoir de très bonnes connaissances en informatique et tout ce qui concerne les technologies du Big Data, la mise en place de modèles statistiques notamment de machine learning. Il doit être dynmique, autonome, avoir une force de proposition, le sens du relationnel et doit savoir travail en équipe.
Les objectifs principaux de l’Analyse des Correspondances Textuelles sont d’étudier et de visualier les proximités entre documents, dans notre cas il s’agit des offres d’emploi concernant les data engineers, data scientists et data analysts. Elle permet également de visualiser les proximités entre mots ainsi que les associations entre mots et documents.
Le plan factoriel formé par les axes 1 et 2 résume toute l’information contenue dans notre jeu de données. Cela nous permet donc d’avoir une représentation de très bonne qualité.
Le premier axe range les métiers par niveau de technicité. Plus on est situé à gauche, plus les compétences techniques demandées sont élevées et inversement. En effet, un data engineer est quelqu’un ayant un background technique (en développement logiciel le plus fréquemment), le data scientist quant à lui est chargé de la gestion, de l’analyse et de l’exploitation des données massives d’une entreprise. A l’ère du Big Data, le data scientist peut être considéré comme une évolution du Data analyst dans le sens où il possède des compétences techniques que n’aurait pas un data analyst. Concernant le second axe, on observe qu’il sépare clairement les 3 métiers.
Cette représentation graphique nous permet d’observer la superposition des différents métiers et des mots qui s’associent à ces derniers. En effet, cette représentation graphique tient compte des relations des barycentriques. En d’autres termes, les mots situés au centre du nuage sont communément employés dans les offres d’emplois de ces trois profils et les mots qui s’éloignent du centre sont les mots qui sont propres à un profil particulier, à savoir ici : data analyst, data scientist et data engineer. Ainsi le premier axe oppose les mots machine, science et modèle, sur-employé pour les profils de type data scientist et les mots marketing, gestion, tableau et BI sur-employés par les profils de types data analyst. Cela vient confirmer l’interprétation que nous avions faite du premier axe. C’est-à-dire qu’il sépare les catégories selon le degré de technicité lié au profil. Concernant le poste de data engineer, qui requiert également des compétences assez techniques, on observe bien son opposition par rapport au profil data analyst et une proximité avec le poste de data scientist. Ainsi, des mots tels que technologie, application et source s’avèrent être sur-employé dans les offres concernant ce profil.
La représentation des mots les plus contributifs vient confirmer notre analyse réalisée précédemment sur le graphique de la représentation simultanée des métiers et des mots qui s’y associent. En effet, les mots les plus contributifs sont ceux dont le poids à fortement contribué à la construction d’un axe. En d’autres termes, les mots présents sur ce graphique, sont ceux qui apportent le plus d’information.
Par conséquent, les mots tels que engineering et technologie sont des mots très employés dans les offres concernant les profils data engineer dont les compétences sont généralement assez techniques telles que l’architecture de base de données ou encore le dévelopemment logiciel. Cependant, ces mots sont moins employés dans des offres concernant le profil de data analyst. De manière inverse, les mots gestion et marketing sont fortement utilisés dans les offres concernant les data analysts. En effet, de manière générale, son objectif est d’apporter une aide à la décision grâce à la mise en valeur des données grâce à techniques statistiques. Concernant les offres adressées aux profils de type data scientist, les mots qui apparaissent fortement sont machine qui fait référence au machine learning et science qui renvoie à la data science. Assez proche du data analyst, le data scientist exploite également les données pour en tirer des informations mais ses compétences en programmation lui permettent d’aller plus loin en proposant notamment des analyses prédictives.