Google a officiellement annoncé Gemini 2.0 mercredi, la dernière mise à niveau de son modèle d’IA phare. Plus précisément, Google déploie “Gemini 2.0 Flash experimental”, succédant à Gemini 1.5 Flash. Les modèles Flash de Google sont ses modèles “légers”, conçus pour des tâches qui n’exigent pas les modèles d’IA les plus puissants possibles, et se concentrent davantage sur l’efficacité. Toutefois, Google affirme que Gemini 2.0 Flash améliore non seulement les modèles Flash tels que Gemini 1.5 Flash, mais également des modèles plus puissants comme Gemini 1.5 Pro.
Comment Gemini 2.0 Flash se compare-t-il aux autres modèles ?
Google indique que 2.0 Flash bat à la fois 1.5 Flash et 1.5 Pro dans plusieurs catégories, y compris le benchmark général MMLU-Pro, trois benchmarks de codage différents, un test de factualité, deux benchmarks mathématiques, le raisonnement, deux benchmarks d’images et des benchmarks vidéo. Certaines de ces victoires étaient proches des performances de 1.5 Pro, cependant d’autres ont montré des améliorations significatives, comme une augmentation de 7,5 points dans le benchmark Natural2Code, ou une augmentation de neuf points dans le benchmark HiddenMath. 1.5 Pro bat toujours 2.0 Flash dans le benchmark audio (40,1 % contre 39,2 %) et le benchmark de contexte long (82,6 % contre 69,2 %).
En plus de ces améliorations, Google indique que 2.0 Flash prend en charge de nouvelles sorties multimodales, telles que des images générées par l’IA combinées avec du texte et de l’audio texte-à-parole. De plus, il peut intégrer Google Search, exécuter du code, en plus d’autres fonctions tierces.
Où verrez-vous Gemini 2.0 Flash ?
Vous verrez probablement beaucoup de Gemini 2.0 Flash, que vous le sachiez ou non. La société a annoncé qu’elle utiliserait Gemini 2.0 pour la recherche, notamment pour les vue d’ensemble AI. Le déploiement initial des résumés de recherche IA de Google a été, sans équivoque, un désastre. Néanmoins, la société exprime de l’optimisme quant à cette fonctionnalité : Google dit que Gemini 2.0 permettra aux vues d’ensemble IA de gérer des sujets plus compliqués et des requêtes en plusieurs étapes, ainsi que de nouvelles fonctions comme les mathématiques avancées, des questions multimodales (par exemple des requêtes à partir de texte, d’images, de documents, etc.) ainsi que le codage.
2.0 Flash arrive également sur l’application Gemini. En fait, il est déjà disponible sur le bureau et l’expérience web mobile. Vous devrez simplement choisir le modèle dans le menu déroulant avant de l’essayer.
Google veut que l’IA fasse le travail pour vous
Google fait la promotion de 2.0 Flash comme faisant partie de son “ère agentique”. Ce que cela signifie, c’est que Google veut que ses produits fassent plus en votre nom, que ce soit analyser une question ou votre environnement, ou même accomplir une tâche pour vous. La société dit qu’elle travaille sur des mises à jour pour le Projet Astra, le département de recherche de Google responsable du développement d’un “assistant IA universel” ; le Projet Mariner, une extension Chrome qui utilise l’IA pour vous aider pendant que vous naviguez sur le web ; et Jules, l’agent alimenté par IA de la société pour aider les développeurs à écrire du code.
Google a également mis en avant une nouvelle fonctionnalité qu’elle appelle “Deep Research“, un assistant de recherche alimenté par IA qui vise à analyser des sujets et à générer des rapports pour vous. Vous invitez le bot avec un sujet ou une question que vous souhaitez explorer, et il développe un plan de recherche pour que vous puissiez l’approuver ou le modifier. Une fois approuvé, il scrute internet à la recherche de sources et compile un rapport complet que vous pouvez exporter vers Google Docs. Comme les vues d’ensemble IA, il inclut des liens vers les sources qu’il utilise, afin que vous puissiez les consulter par vous-même.