Actualité

Suivre les offres d’emploi en ligne pour mieux comprendre le marché du travail

Aujourd'hui, beaucoup d'offres d'emploi sont publiées en ligne, et parfois sur différents sites internet. Avec Jocas, la Dares utilise ces millions d'offres pour contribuer à améliorer la compréhension du marché du travail. Yannis Bouachera, data scientist à la Dares, nous explique.

Qu’est-ce que Jocas ?  
Yannis Bouachera
: Job offers collection and analysis system (Jocas), est une base de données innovante mise en place par la Dares : elle recense les offres d’emploi publiées sur les principaux sites français d’offres d’emploi en ligne – avec leur accord. Elle élargit grandement le champ en comparaison des sources de données administratives classiques telles que les statistiques du marché du travail (STMT) - constituées à partir des fichiers de gestion de France Travail (ex-Pôle emploi).

Les données sont collectées par « scraping ». C’est-à-dire que chaque jour, depuis septembre 2018, différents algorithmes développés par la Dares récoltent toutes les offres publiées sur une sélection d’une dizaine de sites d’offres d’emploi. Les données sont ensuite : harmonisées de façon à se référer aux nomenclatures usuelles de la statistique publique ; et dédupliquées régulièrement afin d’éliminer les offres publiées sur plusieurs sites.
 
Jocas complète donc les données existantes ?
Yannis Bouachera
: Tout à fait. Le contexte a changé : ainsi, au cours des dernières années, selon l’enquête Offre d’emploi et recrutement (Ofer) de la Dares, 95 % des offres d'emploi ont été publiées en ligne en 2016, contre 53 % en 2005. Afin de produire des données, les plus représentatives possible, il est nécessaire de prendre en compte, au-delà des offres d’emploi déposées par les recruteurs à France Travail, celles d’autres sites internet. C’est particulièrement le cas pour les emplois de cadres, souvent proposés sur des sites spécialisés.

Les données récoltées par Jocas sont très riches : la description des offres permet notamment d’obtenir de nombreuses informations sur les attentes et les propositions des recruteurs (en termes de compétences, d’avantages, de rémunérations, etc.) ce qui permet d’envisager de nouvelles études sur le marché du travail à travers l’analyse des offres d’emploi.

Afin de produire des données, les plus représentatives possible, il est nécessaire de prendre en compte, au-delà des offres d’emploi déposées par les recruteurs à France Travail, celles d’autres sites internet. C’est particulièrement le cas pour les emplois de cadres, souvent proposés sur des sites spécialisés.

Quels autres types de données ou études peuvent être produites grâce à cette base de données ?
Yannis Bouachera
Jocas est déjà utilisée par la Dares dans l’élaboration des indicateurs de tension sur le marché du travail, principalement en comparant le volume d’offres d’emploi publiées en ligne au nombre de demandeurs d’emploi inscrits à France Travail. Les pistes d’études à partir de Jocas sont multiples : mention du télétravail, problématique autour de la transition écologique, etc. La collecte quotidienne des données permet d’envisager un suivi quasiment en « temps réel » : cela a notamment été le cas durant la pandémie.

En parallèle, nous avons aussi lancé plusieurs études et continuons de travailler sur l’exploitation de nouvelles variables, notamment à travers un projet d’extraction des compétences à partir des descriptions des offres.

Vous avez terminé la phase expérimentale, vous envisagez donc de mettre à disposition d’un plus grand public la base de données ?

Yannis Bouachera : Nous avons stabilisé le scraping et le traitement des données. Pour faciliter l’exploitation de Jocas à l’avenir, nous sommes déjà en train de retravailler l’architecture et d’héberger les données sur une plateforme qui nous permettra, dans un futur proche, de rendre les données accessibles aux étudiants, aux chercheurs et à toute la statistique publique. Cette plateforme permettra d’accéder à des ressources de calcul et de stockage importantes afin d’exploiter au mieux les millions d’offres récoltées chaque année par Jocas. L’harmonisation et la  seront automatisées et pourront être effectuées quasiment en temps réel.

Nous contribuons également à un projet européen visant à collecter et exploiter les offres d’emploi en ligne, ce qui nous permet de partager notre expérience et de nous tenir à jour des travaux menés sur ce type de données à l’international. En attendant la fin de la refonte de l’architecture, un échantillon des données Jocas (sur l’année 2020) est déjà disponible sur la plateforme Progedo, à destination des chercheurs.