Amazon lance une version d'Alexa dopée à l'IA pour discuter avec son enceinte connectée

La nouvelle version de l'assistant d'Amazon, Alexa, promet de devenir un "compagnon" conversationnel. - Amazon
La guerre de la maison connectée est bel et bien lancée, et Amazon vient de faire un premier pas de géant. En domotique, le protocole Matter, ce langage unifié entre appareils de différents constructeurs qui vont être utilisables avec n’importe quelle porte d’entrée (Google, Apple, Amazon, Samsung, etc.), fait beaucoup parler de lui avec sa promesse de faciliter les usages dans la maison.
Une autre bataille se dessine aussi en parallèle: quel assistant vocal va devenir la clé de votre maison pour tout piloter? À ce jeu-là, Google Assistant, Siri d’Apple et Amazon Alexa notamment tentent de tout faire pour séduire les utilisateurs et devenir la voix de la raison connectée, celle qui commandera à tous les appareils.
L’avenir de l’assistant vocal conversationnel
Implanté dans les objets connectés depuis 2014, fort de près de 500 millions de produits différents dans le monde, de dizaines de millions d'interactions par heure, l’assistant Alexa compte déjà une présence massive dans les foyers.
Mercredi 20 septembre, lors de sa conférence produits et services tenue dans ses nouveaux bureaux d’Arlington, près de Washington, Amazon a dévoilé une toute nouvelle version d’Alexa, boostée à l’IA générative. C’est un peu comme si Bard ou ChatGPT devenait le cerveau d’un assistant vocal, lui ouvrant de tout nouveaux horizons. Google travaille à intégrer Bard à Google Assistant, mais s’est fait damer le pion par son concurrent.
Car ce que Dave Limp, futur ex-patron d’Amazon Devices et services, a présenté, c’est une nouvelle idée d’Alexa qui sera désormais capable de tenir des conversations naturelles et fluides, basées aussi sur les connaissances qu’elle a de vous et sur les informations que vous lui donnez pour contextualiser ses réponses.
"C’est l’avenir d’Alexa à l’IA générative", explique à Tech&Co Daniel Rausch, vice-président Amazon Alexa et Fire TV. "Un nouvel ensemble de capacités fondamentales qui arrive pour que la conversation devienne plus naturelle, plus personnalisée et contextualisée. Un échange avec l’assistant vraiment conversationnel."
Alexa n’a plus besoin d’être interpellé à chaque demande. L’assistant vocal intégré dans l’enceinte ou dans l’écran intelligent sait quand vous vous adressez à lui, car il s'appuie sur les capteurs de proximité et sur la caméra pour détecter votre regard. "Il suffit de porter attention à Alexa. Elle sait quand vous regardez la caméra par exemple pour vous répondre. Si vous détournez le regard, elle sépare le contexte et reprend par la suite la discussion, avec un ton naturel et sans avoir besoin de l’interpeller" se félicite Daniel Rausch. "Ça devient un plaisir d’interagir avec elle."
Un ami avec qui discuter
Depuis que ChatGPT a secoué le monde de l’intelligence artificielle fin 2022, les avancées en matière de conversation ont fait des pas de géant. Chacun veut son agent conversationnel, son assistant personnel omniscient et omnipotent, capable de vous épauler au quotidien et surtout de vous comprendre
"On est à un point d’inflexion et cela ne se produit pas tous les ans en technologie", reconnaît-il. "Quand cela arrive, cela peut tout changer."
Et du côté d’Amazon, on espère être le premier à arriver à ce tournant, en étant déjà les premiers à l'apporter à des appareils connectés du quotidien.
Dans tous les produits Amazon Echo, même de toute première génération, Alexa fera bientôt des miracles. Les autres appareils partenaires devraient suivre, nous confie-t-on. "C’est comme de parler naturellement à un ami", note très justement Charlie French, directeur de la maison connectée chez Amazon.
Sur scène, les démonstrations orchestrées à l’aide du nouvel écran Echo Show 8 ont laissé poindre à l’horizon une personnalité d’Alexa teintée d’humour, d’une voix aux intonations naturelles qui répond aussi bien à des informations générales, aux demandes de créativité (écrire un poème d’amour) ou adapte ses réponses à vos questions, même parfois subjectives ("conseille-moi un film qui aurait mérité de gagner un Oscar"). Amazon sait que la personnalité d'Alexa a fait sa force depuis longtemps et appuie sur ce point pour la rendre encore plus humaine.
Mais le plus bluffant a été sa capacité à tenir une conversation saccadée jusqu’à aboutir à une action sans avoir besoin de se refaire préciser un contexte. On est ainsi passé d’une demande d’un résultat sportif de son équipe préférée, à la date du prochain match avant de finir par élaborer un message à envoyer à ses amis pour les inviter à venir le voir chez soi, avec un menu adapté à ses goûts… mais aussi à une météo qui annonce de la pluie, adieu le barbecue !

Le modèle linguistique basé sur les interactions vocales, peaufiné depuis des années par Amazon porte ainsi ses fruits. Rohit Prasad, en charge du développement de l’IA chez Amazon, précise que la nouvelle Alexa conversationnelle est le résultat d’un travail interne des équipes pour la rendre la plus sûre et sécurisée possible, capable aussi d’être véritablement factuelle et de ne pas inventer des faits, dire n’importe quoi ou devenir insultante. Une façon de rappeler quelques errances de ChatGPT ou de BingAI.
Après le regard et la voix, le langage corporel comme élément d’interaction
Et pour appuyer ses dires, Amazon a ainsi montré ses prouesses pour l’amélioration de son moteur de recherche de films sur son interface Fire TV afin d’arriver à un véritable contenu proposé qui vous ressemble et corresponde à l’idée qu’Amazon a de vos goûts, en fonction de vos recherches et visionnages précédents. Alexa pourra aussi, à la façon de Midjourney, vous concevoir un fond d’écran selon vos souhaits pour votre environnement Fire TV.
Alexa va ainsi avoir des allures de véritable assistant personnel avec lequel avoir un échange digne de celui de Joaquin Phoenix et son IA dans le film Her. Mais au-delà du simple effet waouh dégagé par Alexa new look, c’est aussi la philosophie d’Amazon qui prend forme: s’assurer que vous lui restiez fidèle à travers les objets maison, les services, quel que soit votre type de smartphone, tant que vous avez recours à l’assistant vocal ultime qui sera là à chaque instant de votre quotidien, pour chaque situation.
Et Amazon l’a promis, l’étape suivante se précise déjà: qu’Alexa soit capable de comprendre votre langage corporel pour peaufiner ses réponses.
La nouvelle version d’Alexa sera déployée d’ici la fin de l’année en anglais. La France devra encore patienter avant d’en profiter. Mais on nous promet rapidement.