BFM Business

Comment Facebook vous fait travailler gratuitement pour lui

-

- - -

Pour améliorer ses outils de reconnaissance d'images, l’entreprise met à contribution les utilisateurs d’Instagram.

Poster une photo de votre Jack Russell ravira probablement votre entourage, mais également Facebook. Dans un article de blog, cinq ingénieurs de la firme américaine expliquent comment ils mettent à profit les images publiées par les utilisateurs d’Instagram - filiale de Facebook depuis 2012 - pour parfaire leurs logiciels de reconnaissance d’images. Leur principal outil: les hashtags (mots-clés associés à une image) ajoutés par les internautes.

Facebook rappelle les difficultés des programmes de reconnaissance d’images qui, contrairement aux humains, ont besoin d’être confrontés à des milliers d'images d’un même sujet pour pouvoir l’identifier avec succès. Or étiqueter manuellement une aussi grande quantité d'images pour “entraîner” la machine représenterait une tâche titanesque pour les employés de Facebook. Ils ont donc décidé d’utiliser le travail des membres d'Instagram, qui se chargent du travail par eux-mêmes, gratuitement. Par exemple, placer le mot-clé #JackRussel sous une photo de son chien permet de donner une information précieuse au logiciel de reconnaissance d'images.

85.4% de réussite

Facebook peut compter sur 3,5 milliards d’images publiques, référencées grâce à quelques 17.000 mots-clés. A titre d’exemple, le hashtag #JackRussel renvoie vers plus de cinq millions de photos publiques. En parcourant un milliard d’images réparties selon 1500 mots-clés, le logiciel a pu obtenir un taux de fiabilité de 85,4%, contre 83,1% pour les modèles précédemment utilisés. La stratégie de Facebook semble donc payante.

A terme, l’entreprise espère pouvoir utiliser son outil pour aider les malvoyants et non-voyants, mais également pour identifier des objets, aliments ou animaux avec davantage de précision.

-
- © -

La firme de Mark Zuckerberg n’est pas la seule à faire travailler gratuitement les internautes. C’est également le cas de Google, qui met leur temps à profit depuis de longues années. L’entreprise, qui gère les Captcha - tests d’identification permettant de prouver qu’un utilisateur n’est pas un robot, s’en sert pour améliorer ses propres outils de reconnaissance d’image. Elle demande ainsi aux internautes de reconnaître du texte ou les éléments d’une photo que ses propres algorithmes ne sont pas parvenus à identifier.

https://twitter.com/GrablyR Raphaël Grably Chef de service BFM tech