Google renforce considérablement son écosystème d'IA Gemini avec plusieurs améliorations clés, axées sur des interactions audio plus naturelles, une génération musicale avancée et une accessibilité élargie pour ses fonctionnalités de recherche basées sur l'IA. Ces mises à jour visent à approfondir l'engagement des utilisateurs avec les outils propulsés par Gemini et à étendre l'avantage concurrentiel des offres d'IA de Google.
Le modèle Gemini 3.1 Flash Live, désormais disponible, promet des interactions vocales plus naturelles et fiables. Cette mise à niveau est intégrée dans divers produits Google, visant une latence réduite et une précision accrue dans les conversations vocales. Pour les développeurs, la possibilité d'échanger qualité contre vitesse, tout en maintenant les prix au niveau de Gemini 2.5, offre une flexibilité pour diverses applications, comme détaillé par Google AI Blog ici et DeepMind ici. Cela a un impact direct sur les outils qui dépendent de l'entrée et de la sortie vocales, les rendant plus conversationnels et conviviaux.
Google fait également progresser ses outils de génération musicale par IA avec l'introduction de Lyria 3 et de son itération plus avancée, Lyria 3 Pro. Lyria 3 est désormais accessible via un aperçu payant via l'API Gemini et Google AI Studio, permettant aux développeurs d'expérimenter ses capacités. Lyria 3 Pro, conçu pour les professionnels, se concentre sur la génération de pistes musicales plus longues et structurellement conscientes, et est intégré dans davantage de produits Google. Cette décision positionne les outils musicaux d'IA de Google comme des concurrents sérieux pour les professionnels de la création, impactant potentiellement les stations de travail audio numériques et les logiciels de production musicale qui pourraient s'intégrer à ces API, comme rapporté par Google AI Blog ici et ici, et TechCrunch ici.
Pour élargir encore la portée de Gemini, Google déploie Search Live dans plus de 200 pays. Cette fonctionnalité transforme la caméra d'un téléphone en un outil de recherche IA en temps réel, permettant aux utilisateurs d'interagir avec Google Search en utilisant à la fois la voix et l'entrée visuelle. Ce déploiement mondial d'un puissant outil de recherche visuelle et vocale améliore l'utilité de Gemini en tant qu'assistant complet. De plus, la fonction Traduction instantanée avec écouteurs de Google Translate est désormais officiellement disponible sur iOS et s'étend à davantage de pays pour les utilisateurs iOS et Android, rendant la traduction en temps réel plus accessible. Ces mises à jour soulignent l'engagement de Google à rendre ses outils d'IA plus intégrés et pertinents à l'échelle mondiale, comme souligné par The Decoder ici et Google AI Blog ici.
Dans le but de capter une base d'utilisateurs plus large, Google a lancé des "outils de migration" qui facilitent le transfert de conversations et d'informations personnelles depuis d'autres chatbots directement vers Gemini. Cette initiative vise à abaisser la barrière pour les utilisateurs envisageant de passer à Gemini, augmentant potentiellement sa base d'utilisateurs et son ensemble de données pour un entraînement supplémentaire des modèles. Cette manœuvre concurrentielle, rapportée par TechCrunch ici, a un impact direct sur le paysage concurrentiel entre les principaux fournisseurs de chatbots IA.
Tendances, nouveaux outils et analyses exclusives, chaque semaine.