Tech&Co
Google

Que vaut AI Edge Gallery, l'appli de Google qui permet d'utiliser l'IA sans internet?

placeholder video
Conversations, traductions, résumés... Depuis fin mai, Google permet d'utiliser des modèles d'IA sans connexion internet depuis une application expérimentale.

Un lancement en toute discrétion. Depuis fin mai, Google propose une application permettant d'utiliser l'intelligence artificielle en local et sans connexion internet. Son nom: Google AI Edge Gallery. Disponible sur les smartphones Android, et bientôt sur l'iPhone, elle est présentée comme "une application expérimentale qui met la puissance des modèles d'IA générative de pointe dans vos mains, tournant entièrement sur vos appareils".

Avec Google AI Edge Gallery, il est en effet possible de discuter avec une IA, de soumettre une image et de questionner un modèle sur celle-ci ou encore d'obtenir un résumé d'un texte. Mais que vaut cette nouvelle application? Tech&Co l'a testé.

Comment télécharger et utiliser Google AI Edge Gallery

Pour commencer, Google AI Edge Gallery n'est pas disponible sur le Play Store. Pour la télécharger, il est nécessaire de passer par la plateforme Github et de télécharger un fichier APK. Une installation qui se fait rapidement et sans difficulté. L'application provenant de Google, elle ne présente aucun danger. Elle peut cependant comporter des bugs, étant encore au stade expérimental.

L'application Google AI Edge Gallery.
L'application Google AI Edge Gallery. © Google

Une fois Google AI Edge Gallery installé sur votre smartphone, trois fonctions sont proposées: "Ask Image", "Prompt Lab" et "AI Chat". Pour chacune d'entre elles, Google précise le nombre de modèles disponibles. Pour le premier, qui permet de questionner une IA sur une image, deux modèles Gemma, qui proviennent tous deux de l'entreprise, sont par exemple proposés.

Mais avant de pouvoir les utiliser, il est nécessaire de les télécharger. Une connexion internet est ainsi nécessaire. Ce n'est qu'une fois cela fait qu'il sera possible de se passer d'internet.

Identification, traduction...

Pour "Ask Image", il suffira alors de soumettre une image puis d'interroger le modèle, qui répond en quelques secondes.

À la demande de l'utilisateur, il peut indiquer les objets présents sur l'image, traduire le texte présent sur celle-ci ou même expliquer comment se rendre à un endroit. Mais comme l'a constaté Tech&Co, les réponses du modèle ne sont pas toujours exactes.

L'IA n'a pas correctement identifié tous les objets figurant sur cette image.
L'IA n'a pas correctement identifié tous les objets figurant sur cette image. © Tech&Co

En le questionnant sur ce qu'il voit sur la photo ci-dessus, le modèle a par exemple répondu que les deux figurines étaient des Lego, alors que ce n'est pas le cas. Celle à gauche est un Playmobil tandis que celle à droite est la mascotte de la marque Realme. Il a aussi assuré que le carnet sur lequel sont placées les deux figurines était une tablette numérique.

L'IA de Google a affirmé à tort que les deux figurines étaient des Lego.
L'IA de Google a affirmé à tort que les deux figurines étaient des Lego. © Tech&Co

L'IA peut aussi rencontrer des difficultés pour la traduction. Lorsqu'on lui a soumis une image en lui demandant de traduire en français le texte qui y figurait, elle a répondu en laissant le texte en anglais.

L'IA de Google a quelques difficultés pour traduire les textes dans les images.
L'IA de Google a quelques difficultés pour traduire les textes dans les images. © Tech&Co

Elle s'en est beaucoup mieux sortie avec une autre image, comprenant les instructions pour une cafetière connectée, mais il y avait encore quelques erreurs. Elle a par exemple traduit "Connect the mains plug of the coffee machine to a wall socket" par "Connectez votre machine à café à un mur" au lieu de "prise murale".

L'IA de Google commet toujours quelques erreurs.
L'IA de Google commet toujours quelques erreurs. © Tech&Co

Enfin, le modèle d'IA peut aussi être utilisé pour découvrir comment se rendre à un endroit. Il est parvenu à identifier l'Arc de Triomphe et à indiquer comment s'y rendre en partant de La Défense, que ce soit en métro, en voiture ou encore à vélo.

L'IA de Google a bien identifié l'Arc de Triomphe et ensuite proposé divers itinéraires.
L'IA de Google a bien identifié l'Arc de Triomphe et ensuite proposé divers itinéraires. © Tech&Co

Options pour lesquelles il précise la durée estimée, le coût, ainsi que les avantages et inconvénients.

L'IA de Google propose plusieurs options pour arriver à l'Arc de Triomphe.
L'IA de Google propose plusieurs options pour arriver à l'Arc de Triomphe. © Tech&Co

Pour conclure, l'IA a résumé le tout et conseillé l'utilisation de certaines applications, comme Google Maps, pour "obtenir des itinéraires en temps réel".

Discussions difficiles

La nouvelle application de Google permet aussi de discuter avec une IA comme on le fait avec ChatGPT ou Gemini. Mais uniquement par texte. Quatre modèles sont disponibles, dont trois de Google et un de l'entreprise chinoise Alibaba. "Bonjour (...) Je suis un assistant virtuel qui peut vous aider dans de nombreux domaines", répond ce dernier lorsqu'on lui dit "bonjour".

Le modèle d'Alibaba ne parvient pas à écrire la lettre "é".
Le modèle d'Alibaba ne parvient pas à écrire la lettre "é". © Tech&Co

Mais les problèmes se manifestent rapidement dans la conversation. Le modèle d'Alibaba ne parvient pas à écrire la lettre "é", la remplaçant systématiquement par deux caractères spéciaux, comme le montre l'image ci-dessus.

Le modèle d'Alibaba peut manquer de logique dans ses réponses.
Le modèle d'Alibaba peut manquer de logique dans ses réponses. © Tech&Co

Et c'est devenu pire lorsqu'on lui a demandé pourquoi, avec une réponse remplie d'absurdités. Si l'expérience est meilleure avec les modèles de Google, elle est loin d'être parfaite. Pour l'un d'entre eux par exemple, chaque réponse est à un moment interrompu par la chaîne de caractères "<0xC2>".

Les modèles de Google ont aussi quelques difficultés.
Les modèles de Google ont aussi quelques difficultés. © Tech&Co

Il peut aussi faire preuve d'incohérence dans ses propos, intégrant des tirets à tout va et des phrases qui n'ont aucun sens.

Des fonctions bien utiles mais...

Enfin, le Prompt Lab, composé des mêmes quatre modèles que "AI Chat", propose quatre fonctions. Parmi elles, le résumé d'un texte et le changement de ton d'un message. Pour la première, plusieurs options sont proposées, dont "résumé concis" (environ 50 mots), points-clés (3 à 5) ou encore "court paragraphe".

Avec le modèle Qwen d'Alibaba, les résultats étaient loin de convenir. En lui soumettant un article de Tech&Co à résumer en 50 mots, l'IA a répondu avec une série de hashtags, avec des mots qui n'avaient aucun rapport avec le sujet. L'article en question parlait en effet de Samsung et d'une future version "Ultra" de son smartphone pliant et dans les hashtags mentionnés par l'IA figurent les mots Apple et iPad.

Le modèle d'Anthropic rencontre aussi des difficultés pour les résumés de textes.
Le modèle d'Anthropic rencontre aussi des difficultés pour les résumés de textes. © Tech&Co

Elle s'en est mieux sortie lorsqu'on lui a demandé un petit paragraphe, mais celui-ci était en anglais. Un problème qui est d'ailleurs récurrent avec cette fonction et qui n'est pas réservé qu'au modèle d'Alibaba. Autre problème: l'IA peut se répéter dans son résumé, mentionnant par exemple à deux reprises que cette future version "Ultra" disposerait d'un "puissant appareil photo".

Les modèles de Google peuvent transmettre de fausses informations dans leurs résumés.
Les modèles de Google peuvent transmettre de fausses informations dans leurs résumés. © Tech&Co

Avec les modèles de Google, l'IA a généré de bons résumés dans l'ensemble. Elle s'est cependant trompée, dans le résumé de 50 mots, en affirmant que Samsung avait dévoilé une version "Ultra" de son smartphone pliant, ce qui n'est pas le cas. Le résumé en mots-clés était, lui, bien meilleur, avec toutes les bonnes informations qui étaient bien résumées.

Enfin, que ce soit avec les modèles de Google ou celui d'Alibaba, le seul problème avec la fonction permettant de changer le ton d'un texte était que le résultat était systématiquement en anglais. Plusieurs options sont proposées (formel, amical, poli, enthousiaste...), avec des résultats convaincants. Et dans certains cas, l'IA ne se contente pas seulement de transformer le texte, elle explique aussi ses choix.

Les modèles de Google et Alibaba s'en sortent bien pour le changement de ton d'un texte.
Les modèles de Google et Alibaba s'en sortent bien pour le changement de ton d'un texte. © Tech&Co

Pour le ton "enthousiaste", l'IA intègre par exemple des emojis dans son message et explique que cela "ajoute de l'enthousiasme et une ambiance sympa", ainsi que le choix de certains termes.

Si l'application de Google est encore loin d'être parfaite, il ne faut pas oublier qu'il s'agit encore d'une version expérimentale. Elle est donc amenée à s'améliorer avec le temps. Mais en attendant, les résultats ne sont pas très convaincants pour la plupart des fonctions proposées.

Kesso Diallo