La voix pour les contrôler tous : Windows 12 envisage de vous faire oublier votre souris et votre clavier

Après Copilot et sa touche dédiée, différents ajouts de fonctions IA au fil du temps, Microsoft veut encore accélérer sur l'intelligence artificielle au sein de son système d'exploitation. Pavan Davuluri, le responsable de Windows et des produits Surface, affiche de grandes ambitions pour Windows 12, qui pourrait ainsi permettre de se passer des clics pour une expérience "multimodale" accrue.
"Je pense que l'informatique va devenir plus ambiante, plus omniprésente et continuer à s'étendre à plusieurs formats. Et certainement devenir plus multimodale au fil du temps," explique-t-il dans une interview sur la chaîne officielle de Microsoft.
Il estime que l'ordinateur de demain pourra "regarder votre écran et être conscient du contexte", et ce, grâce à l'IA. Une envie de "lire votre écran" que l'on retrouve aussi chez Google avec le projet Astra ou en réflexion chez Apple pour les prochaines évolutions de l'IA sur les iPhone.
Car cela pourrait en effet vous proposer des actions en fonction de ce qui est affiché à l'écran ou de ce que vous faites sur votre écran. "Vous pourrez parler à votre ordinateur pendant que vous écrivez ou interagissez avec une autre personne. Vous devriez être en mesure d'avoir une machine qui comprend sémantiquement votre intention d'interagir avec elle", ajoute le patron de l'IA chez Microsoft.
Un ordinateur entièrement utilisable à la voix
Microsoft cherche depuis longtemps à faire de la voix un des modes essentiels d'utilisation de Windows. Dans sa vision "Windows 2030", l'entreprise a même laissé entrevoir la fin de l'utilisation du clavier et de la souris pour mieux centrer son fonctionnement sur l'IA et Copilot.

Cela ne veut pas dire que vous allez complètement abandonner vos accessoires traditionnels, mais l'IA sera un moyen de s'en passer le plus souvent possible. Pour ce faire, Windows 12 devrait faire la part belle aux IA agentiques - qui sont des ensembles d'agents IA autonomes, capables d'accomplir des tâches spécifiques, pour mener à bien une action plus large précise et apprendre en permanence de ces interactions.
Mais privilégier des usages par la voix pour les futures interfaces apparaît primordial pour le géant américain. Tout d'abord dans sa volonté permanente de rendre tous ses produits plus facilement accessibles pour les personnes en situation de handicap. Mais aussi avec l'émergence et la forte croissance des interfaces humaines. "Je pense que l'aspect des interfaces humaines aujourd'hui et leur futur dans cinq ans est un axe majeur de développement de Windows pour nous", ajoute Pavan Davuluri.
S'implanter mieux que Gemini
C'est aussi pour cela que Microsoft pourrait proposer un système d'exploitation fait d'assistants IA, complètement intégrés. Face à Gemini ou même à ChatGPT qui viennent s'implémenter "au-dessus" du reste, Windows 12 bénéficierait de l'IA en profondeur avec un Copilot repensé pour être au coeur de l'interface.
Microsoft n'est d'ailleurs pas la seule entreprise à vouloir que la voix devienne la base de l'utilisation d'un outil. Les performances de certaines IA génératives, comme celle de Perplexity, et leur adoption par les utilisateurs montrent qu'il y a du potentiel. Et les IA génératives basées sur la voix lorgnent aussi les centaines de millions d'appareils connectés avec enceinte qui pourraient leur servir de moyen d'expression.
Reste à savoir ce qu'il adviendra des données personnelles. Les IA ont besoin d'accéder à beaucoup de choses pour fonctionner, y comprit des éléments privés. Intégrer une telle fonctionnalité au coeur même de Windows pourrait donc s'avérer être un problème. Il va également falloir constater si le projet de Microsoft est bien compatible avec certains règlements contraignants, comme le RGPD en Europe.