BFM Business

Comment l'Insee prédit l'évolution de l'emploi en lisant le journal

L'Insee s'est basé sur 200.000 articles

L'Insee s'est basé sur 200.000 articles - Squarespace - Wikimedia Commons - CC

L'institut de conjoncture s'est livré à un exercice peu conventionnel: sur la base de 200.000 articles économiques du journal Le Monde, il a construit "un indicateur mensuel du sentiment médiatique" qui s'avère être un bon complément d'informations pour les conjoncturistes.

C'est un peu Le Monde à l'envers. Pour faire ses prévisions l'Insee se base sur…les journaux. L'institut de conjoncture s'est en effet livré à un exercice un peu particulier: voir en quoi les analyses d'articles permettent d'anticiper l'évolution de l'emploi.

"Le développement des techniques d'analyses textuelles permet désormais d'exploiter des articles de presse sur le long terme en les résumant sous la forme d'un sentiment médiatique", affirme ainsi Vladimir Passeron, chef du département conjoncture de l'Insee.

Le procédé n'est pas si novateur. Ainsi l'économiste norvégien Leif Anders Thorsrud expliquait dans un papier académique publié en juin dernier comment il avait utilisé des journaux économiques norvégiens pour prédire le PIB trimestre par trimestre. Il affirmait même que la méthode utilisée lui avait permis de faire mieux que des experts de banque centrale (avec une performance 15% plus élevée).

Des "dictionnaires de sentiments"

Mais revenons à l'Insee. Pour son exercice, l'institut de statistiques a retenu des articles du journal Le Monde en raison de la "profondeur temporelle" de son contenu en ligne. Il est ainsi possible de retrouver tous les articles publiés par le quotidien du soir depuis 1990, ce qui a permis à l'Insee de constituer une base de données de 1,4 million de textes qui a finalement été réduite à 200.000 pour ne retenir que les articles parlant d'économie.

Pour construire son indicateur, l'Insee a ensuite analysé "la tonalité globale" d'un article, c'est-à-dire si le papier a un ton plutôt positif ou négatif quant aux événements dont il traite (une fermeture d'usine, par exemple va avoir un ton négatif). Évidemment faire analyser un par un les quelque 200.000 articles par un statisticien serait un brin fastidieux. L'Insee a ainsi recours à des "dictionnaires de sentiment". Ces dictionnaires regroupent un certain nombre de mots à connotation positive ou négative. Ils détectent la présence de ces termes puis arrivent à déterminer la tonalité globale de l'article.

L'Insee a en fait utilisé deux dictionnaires. L'un constitué de termes relatifs à l'emploi ("plan d'embauche, "plan social", etc..) et un autre plus généraliste (avec des mots comme "amélioration", "favorable", "instabilité", etc….). Chaque article obtient alors un "score de sentiment".

Des compléments plus que des substituts

L'Insee calcule ensuite son "indicateur du sentiment médiatique" en faisant la moyenne sur le mois de ces scores. En fait l'institut en a créé deux: un "global" et un plus spécifiquement centré sur l'emploi, rapport aux deux dictionnaires précités.

Au final, il apparaît que ces indicateurs sont fortement corrélés avec l'évolution de l'emploi (surtout l'indicateur global qui a un coefficient de 0,8, 1 étant le maximum). L'Insee s'est alors demandé si ces indicateurs de sentiment médiatique pouvaient permettre de faire des prévisions. "De tels indicateurs apportent un signal rapide pertinent et lisible sur les fluctuations à court terme de l'emploi et présentent des caractéristiques similaires aux indicateurs construits à partir de nos enquêtes de conjoncture", relève d'ailleurs Vladimir Passeron.

-
- © -

Pas au point toutefois de remplacer les indicateurs traditionnels sur lesquels se base l'Insee pour prévoir l'évolution de l'emploi. L'Institut a ainsi réalisé des simulations et il s'est avéré qu'un modèle de prévisions avec seulement l'indicateur du sentiment médiatique se trompe plus que celui avec le climat des affaires. Mais l'Insee remarque aussi qu'un troisième modèle, qui combine à la fois le climat des affaires et le sentiment médiatique, est en fait plus performant de tous.

"Pour le conjoncturiste l'information médiatique peut être un complément aux enquêtes de conjoncture mais à ce stade de l'analyse il ne se substitue pas (à ces enquêtes, ndlr)", conclut ainsi Vladimir Passeron.

Note: une journaliste du Monde présente lors de la présentation de cet indicateur à la presse a tenu à préciser que le quotidien n'avait pas participé à son élaboration et que la démarche relevait de la simple initiative de l'Insee.