Le dernier modèle de génération d’images par IA de Google, Imagen 3, est désormais disponible au public aux États-Unis, et il vous suffit d’un compte Google gratuit pour l’essayer. Comme l’a repéré VentureBeat, la société a discrètement ouvert son modèle cette semaine, publiant sa recherche dans un article mardi. Cela survient deux mois après que l’entreprise a annoncé pour la première fois le nouveau modèle au Google I/O en mai dernier.
Dans un post sur Hugging Face, une plateforme de machine learning, les chercheurs de Google ont déclaré : “Nous présentons Imagen 3, un modèle de diffusion latent qui génère des images de haute qualité à partir de prompts textuels. Nous décrivons nos évaluations de qualité et de responsabilité. Imagen 3 est préféré à d’autres modèles à la pointe de la technologie (SOTA) au moment de l’évaluation. De plus, nous discutons des questions de sécurité et de représentation, ainsi que des méthodes que nous avons utilisées pour minimiser les risques potentiels de nos modèles.”
D’après quelques tests amateurs initiaux de ma part, le modèle semble assez solide. Lorsqu’on demande des images photoréalistes, les résultats sont relativement de haute qualité, avec de bons essais de réalisme qui pourraient tromper les gens au premier coup d’œil. (J’ai été particulièrement impressionné par la qualité des images lorsque j’ai demandé au modèle de créer un look de film 35 mm.) Imagen 3 met également en évidence certaines parties du prompt qui ont influencé la sortie, afin que vous puissiez les ajuster si vous n’aimez pas la façon dont l’image est sortie.

Crédit : Jake Peterson/Google
Cependant, les offres d’Imagen 3 affichent toujours les signes révélateurs d’images générées par IA. Dans certaines photos, les mains ont trop de doigts, les visages sont déformés et le texte n’a pas de sens. (Bien que le modèle ait pu reproduire les logos “Coca-Cola” et “Canon” avec une précision qui enfreint les droits d’auteur.)

Crédit : Jake Peterson/Google
Google n’est pas la seule entreprise technologique à lancer un nouveau modèle d’image cette semaine. X a récemment publié une nouvelle version bêta pour Grok, le chatbot IA de l’entreprise, et avec elle, un générateur d’images construit avec apparemment très peu de restrictions. Les utilisateurs (en particulier, Michelle Ehrhardt de Cours Technologie) ont utilisé Grok pour générer tout, de Taylor Swift portant une casquette MAGA à Pikachu tenant un AK-47.
Imagen 3, en revanche, affiche des garde-fous évidents. Lorsque j’essaie de demander au générateur d’images de Google quelque chose de controversé, il s’arrête et me dirige poliment vers la FAQ d’Imagen 3 pour comprendre pourquoi mon prompt n’était pas approprié. Il refuse également de générer du contenu protégé par des droits d’auteur, mais peut être trompé pour en produire avec les prompts adéquats. Comme mentionné ci-dessus, j’ai pu générer des logos, et j’ai même réussi à obtenir des personnages protégés par des droits comme Mario et Pikachu, même si je n’ai pas pu les faire participer à une fusillade.

Crédit : Jake Peterson/Google
Comment essayer Imagen 3
Le nouveau générateur d’images IA de Google est gratuit à essayer pour tout utilisateur américain avec un compte Google. Pour cela, dirigez-vous vers ImageFX dans le AI Test Kitchen de Google. Connectez-vous avec votre compte Google, puis commencez à poser des questions.