«Un instantané de la situation de crise»

02.11.2020 Les offres d’emploi sont une mine d’informations. Exploiter ce trésorreprésente un réel défi. C’est ce queDennisGjokaj, diplômé en informatique, a montré dans son travail de bachelor consacré à l’extraction de données sur une plateforme d’emplois. Grâce à ses investigations, la BFH dispose désormais de données de haute qualité pour approfondir la recherche dans ce domaine.

Comment enêtes-vous venuà enquêter sur les offres d’emploi?

Le crawl, c’est-à-dire parcourir l’internet pour collecter des données, m’a toujours intéressé. C’est mon professeur Erik Graf qui m’a suggéré l’idée d’analyser les offres d’emploi.

Vous appartenez à la première volée de la filière Informatique de la BFH spécialisée en ingénierie des données (Data Engineering). Qu’est-ce qui vous fascine?

Nous avons un peu joué le rôle de cobayes, mais cela en a valu la peine. J’aime apprendre en étudiant des choses apparemment insignifiantes. Les offres d’emploi m’offraient l’opportunité idéale. Comment avez-vous procédé? Il était clair que nous n’avions accès qu’à des documents publics – c’était là le premier problème.

Pourquoi?

Parce que les plateformes disposent de systèmes de défense contre le crawl. Après une série de tentatives, nous avons trouvé la solution. Sur le portail de l’emploi, nous avons ainsi pu accéder quotidiennement aux nouvelles annonces en soumettant des requêtes pour chaque chef-lieu cantonal dans un rayon de 50 kilomètres. Cela nous a permis de collecter environ 700 annonces par jour. Une fois les doublons «triés», nous en avons réuni au moins 55 000.

Comment entreprend-on l’analyse de 55 000 annonces et comment votreordinateur a-t-il géré la tâche en mode télétravail?

Cela paraît énorme, mais un ordinateur peut facilement gérer ce volume de fichiers textes. J’ai pris des échantillons au hasard pour m’assurer que tout fonctionnait bien. En m’aidant de la reconnaissance vocale, je n’ai pas trouvé un seul cas erroné sur 800 offres.

En savoir plus