Gemini Live est le mode de conversation naturel, bavard et immersif de l’application Gemini de Google, et il a reçu une mise à jour significative : l’IA peut désormais répondre instantanément à des questions sur ce qu’elle voit à travers l’appareil photo de votre téléphone et à l’écran de votre téléphone en temps réel. Cette fonctionnalité sera d’abord disponible sur les téléphones Google Pixel 9 et Samsung Galaxy S25.
Vous avez longtemps pu soumettre des photos et des captures d’écran pour que Gemini les analyse, mais c’est l’aspect en temps réel de la mise à jour qui rend cela d’autant plus intéressant : c’est comme si le bot IA pouvait réellement voir le monde qui vous entoure. Vous vous rappelez peut-être qu’une partie de cette fonctionnalité a été présentée par Google sous le nom de Project Astra l’année dernière.
Crédit : Samsung
Samsung déclare que cela “donne l’impression d’avoir un ami de confiance toujours prêt à aider”, tandis que Google affirme que vous pourriez utiliser les fonctionnalités améliorées pour obtenir des conseils d’achat personnalisés, résoudre un problème défectueux ou organiser un espace en désordre. Vous pouvez avoir une discussion avec Gemini Live sur n’importe quoi que vous pouvez viser avec votre appareil photo.
Cette fonctionnalité est désormais disponible en tant que mise à jour gratuite sur les téléphones Pixel 9 et Galaxy S25, d’autres appareils Android la recevront bientôt — bien que la disponibilité plus large soit liée à un abonnement Gemini Advanced. À l’heure actuelle, il n’existe pas encore de liste définitive des téléphones prévus pour la mise à jour, bien qu’il faille présumer qu’un certain niveau de puissance de traitement local soit nécessaire. Rien n’est encore indiqué concernant l’arrivée de cette fonctionnalité sur l’application Gemini pour iPhone.
Comme toujours, le conseil officiel est de “vérifier les réponses pour leur exactitude”, donc juste parce qu’il existe une nouvelle interface sophistiquée à utiliser, cela ne signifie pas que l’IA de Gemini est plus fiable qu’elle ne l’était auparavant. Vous aurez également besoin d’une connexion Internet active pour que cela fonctionne, afin que l’application puisse obtenir de l’aide sur le web.
Crédit : Cours Technologie
La fonctionnalité est facile à trouver : vous pouvez lancer l’interface Gemini Live en touchant le bouton à l’extrême droite de la zone de saisie dans une discussion Gemini (il ressemble un peu à une onde sonore). De là, vous verrez deux nouvelles icônes en bas : une pour accéder à l’appareil photo (l’icône de la caméra vidéo) et une pour accéder à l’écran du téléphone (la flèche à l’intérieur d’un rectangle).
Lorsque vous fermez l’interface Gemini Live, vous trouverez que votre conversation a été enregistrée comme une discussion texte standard, afin que vous puissiez y revenir si nécessaire. Lorsque les nouvelles fonctionnalités sont apparues sur mon Google Pixel 9, je les ai testées en posant des questions dont je connaissais déjà les réponses, afin de vérifier s’il y avait des hallucinations inutiles.
Mise à l’épreuve de Gemini Live
Tout d’abord, j’ai chargé l’interface de la caméra et demandé à Gemini Live à propos de l’épisode Severance que je regardais sur mon ordinateur portable. Au début, l’IA pensait que je regardais You — présumément en confondant ses Penn Badgleys avec ses Adam Scotts — mais elle a rapidement corrigé son erreur en identifiant la bonne émission et en nommant les acteurs à l’écran.
J’ai ensuite demandé à propos d’un colis avec une étiquette UN3481 : des batteries lithium-ion emballées à l’intérieur de l’équipement (des écouteurs audio, dans ce cas). Gemini Live a correctement compris que des batteries lithium-ion étaient impliquées, nécessitant “une attention particulière” lors de leur manipulation, mais n’a donné aucune autre information. Lorsqu’elle a été poussée, elle a déclaré que ces batteries étaient emballées séparément, et non pas dans l’équipement. Mauvaise réponse, Gemini Live — vous pensez à la code UN3480.
Crédit : Cours Technologie
Gemini Live a également pu me dire comment réinitialiser mon Fitbit Charge 6 lorsque j’ai visé mon appareil photo vers lui (bien que l’IA ait d’abord pensé qu’il s’agissait d’un Fitbit Charge 5, ce qui est une erreur assez courante). On peut facilement voir comment cela pourrait être utile si vous essayez de résoudre des problèmes avec des appareils et que vous n’êtes pas tout à fait sûr des marques et des numéros de modèle des dispositifs.
Partager votre écran avec Gemini Live est intéressant. L’application se réduit à un petit widget, vous permettant d’utiliser votre téléphone normalement, puis de poser des questions sur quoi que ce soit à l’écran. Gemini Live a bien fait d’identifier quelles applications j’utilisais, et une partie du contenu de ces applications, comme des affiches de films et des photos de groupes de musique. Il a également traduit avec précision une publication sur les réseaux sociaux dans une langue étrangère pour moi.
Concernant un site web montrant le récent match de football Leicester contre Newcastle, Gemini Live m’a correctement dit quel était le score et quels joueurs ont marqué – toutes les informations étant déjà à l’écran. Cependant, lorsque j’ai demandé quand avait eu lieu le match, l’IA s’est embrouillée et m’a dit qu’il s’était déroulé le 22 mai 2023 (les mêmes équipes jouant, mais il y a presque deux ans).
Crédit : Cours Technologie
Il n’y avait rien à redire sur la rapidité avec laquelle Gemini Live a répondu, et le ton calme et rassurant avec lequel il a réagi, mais il reste encore des problèmes concernant la qualité des résultats. Bien sûr, la commodité d’utiliser cela — pointer la caméra et dire “comment puis-je résoudre cela?” plutôt que de formuler une requête Google complexe — signifie que beaucoup de gens préféreront probablement l’utiliser même avec les erreurs, mais cela reste source d’inquiétude.
Essentiellement, ceci n’est qu’une version améliorée et instantanée de la recherche visuelle : Auparavant, vous auriez simplement tapé “étiquette UN3481” dans Google pour la même requête. Mais alors que la liste des résultats de recherche traditionnels vous permet de voir les informations que vous recherchez et de juger de leur fiabilité et autorité, Gemini Live est beaucoup plus une boîte fermée qui ne montre pas ses méthodes. Bien qu’elle semble parfois magique, à cause de cette interface, le fait de devoir vérifier tout ce qu’elle dit n’est pas idéal.