Ce post fait partie de la série “Exposing AI”, dédiée à l’exploration de six types différents de médias générés par l’IA, en mettant en lumière les particularités communes, les sous-produits et les caractéristiques qui vous aident à distinguer le contenu généré par l’IA de celui créé par les humains.
L’art généré par l’IA n’est plus un simple concept : il est partout, et vous l’avez probablement rencontré dans la nature, que vous le sachiez ou non. L’art IA a remporté des prix (malgré la controverse), a été utilisé dans des films de Netflix (encore une fois avec des critiques) et a trompé un grand nombre d’utilisateurs de Facebook avec des images fausses de bébés, Jésus et légumes. Cela ne risque pas de disparaître de sitôt.
Alors que la technologie de génération d’images continue de s’améliorer, il est plus important que jamais d’apprendre à repérer ces images générées par l’IA, afin de ne pas être trompé par les faux photos de quelqu’un d’autre. Cela peut sembler inoffensif de ne pas se poser de questions sur une image IA de canards, mais lorsque des acteurs malveillants propagent de la désinformation grâce à des images d’IA, les implications sont graves. Les entreprises qui fabriquent des générateurs d’images IA travaillent sur des moyens de “marquer” les images produites par l’IA, mais nous n’en sommes pas encore là. La plupart des œuvres d’art IA en ligne circulent sans étiquette claire avertissant les utilisateurs que les images ne sont pas réelles. En attendant, ces conseils peuvent vous aider à repérer ces images fausses lorsqu’elles apparaissent dans votre fil.
Comment fonctionnent les générateurs d’art IA
Il est facile de regarder une œuvre d’art IA et de supposer que le générateur qui l’a produite a simplement assemblé l’œuvre à partir d’un tas d’images dans sa base de données. Cependant, ce n’est pas tout à fait ce qui se passe ici.
Les générateurs d’art IA sont en effet formés sur d’énormes ensembles de données d’images, allant de l’art aux photographies. Cependant, ces outils ne peuvent pas “voir” ces images comme les humains le font. Au lieu de cela, ils décomposent ces images pixel par pixel. Ils ne verront pas une pomme ; ils verront un groupe de pixels et leurs valeurs. Au fil du temps, ils apprendront que ce regroupement de ces valeurs de pixels particulières a tendance à être une pomme. En formant l’IA sur suffisamment d’images avec suffisamment de contexte, elle commencera à tracer des lignes entre toutes sortes d’objets et de styles. Elle comprendra comment rendre généralement des fruits, des animaux et des personnes, ainsi que des styles artistiques, des couleurs et des ambiances.
Les générateurs d’images IA modernes, comme DALL-E, utilisent ce qu’on appelle la diffusion pour apprendre et générer des images. En gros, ils prennent une image d’entraînement et ajoutent du bruit visuel (pensez à une interférence) à l’image jusqu’à ce que l’ensemble de l’image devienne sans signification. L’idée est de comprendre comment l’image est affectée par l’ajout de bruit à chaque étape : de là, elle essaie le contraire, créant sa propre version de l’image originale à partir de rien que du bruit, ce qui entraîne l’IA à créer des images depuis le début.
C’est une explication extrêmement simplifiée, mais il est important de connaître l’idée fondamentale que ces générateurs s’appuient sur une énorme base de données de relations apprises. Cela permet de rendre des scènes complexes en quelques secondes, mais c’est aussi ce qui entraîne les bizarreries étranges qui peuvent nous aider à identifier une image IA d’une réelle.
Comptez les doigts
L’art IA s’améliore, mais il n’est toujours pas parfait. Bien que ces outils soient capables de générer des images de haute qualité avec un éclairage réaliste, ils ont encore du mal avec les petits détails.
Peut-être de façon la plus célèbre, les sujets “humains” dans l’art IA ont tendance à avoir un nombre de doigts incorrect. Peut-être que le reste de l’image semble convaincant au premier coup d’œil, mais en regardant les mains, vous remarquerez six, sept ou huit doigts sur chacune. Ou peut-être est-ce l’inverse, et la main a trois doigts, dont deux se transforment en un seul. Dans tous les cas, les doigts et les mains auxquels ils sont attachés sont souvent erronés.
Mais bien que les doigts soient ce pour quoi l’IA est la plus connue pour se tromper, ses problèmes ne s’arrêtent pas aux mains. Tout motif répétitif, surtout lorsqu’il s’agit de détails concernant des humains, peut être généré de manière incorrecte avec l’art IA. Regardons les dents d’un sujet dans une image : parfois, il y en a beaucoup trop, ou elles semblent déformées d’une manière qu’elles ne seraient jamais normalement. La plupart d’entre nous n’ont pas de sourires parfaits, mais les dents générées par l’IA sont d’un autre niveau.
Vous pourriez même voir un sujet avec un membre supplémentaire : vous regardez une image, vous vous demandez ce qui semble étrange à son sujet, et tout à coup, vous remarquez le troisième bras du sujet sortant de son sweat à capuche.
Vox a une excellente vidéo explorant pourquoi l’IA a des difficultés avec ces éléments répétitifs, mais, en gros, cela revient à un manque d’expérience de la part de l’IA. Ces outils sont formés sur une énorme quantité de données, mais lorsqu’il s’agit de quelque chose de compliqué, comme les mains, les données dont ils disposent ne fournissent pas suffisamment de contexte pour que le bot sache comment générer correctement et de manière réaliste l’élément. Il ne sait pas comment les mains fonctionnent réellement ; il ne peut tirer que des mains qu’il voit. Nous expérimentons ici les limites de cette connaissance.
Attention aux éléments qui se mélangent
Regardez suffisamment d’art IA, et vous remarquerez quelque chose d’étrange : les choses se mélangent et se transforment les unes dans les autres partout. J’ai déjà mentionné que cela se produit avec les doigts, mais cela peut arriver avec de nombreux autres éléments du sujet, y compris des dents se transformant en d’autres dents, des vêtements se mélangeant dans eux-mêmes, et des yeux qui semblent saigner dans les autres parties de la tête du sujet.
Mais ce ne sont pas seulement les sujets : tout dans l’image est en jeu pour ce mélange. Regardez l’image que j’ai générée avec DALL-E ci-dessous. Le plateau du jeu est ondulé, avec des parties du plateau se transformant en d’autres parties, et des pièces se mélangeant dans les tuiles. Les dents de la femme à droite sont toutes comprimées ensemble, tandis que les poignets du pull de l’autre femme se plient sur eux-mêmes. (Sans mentionner que ses doigts se mélangent en un seul.)

Crédit : Jake Peterson/OpenAI
Critiquez l’écriture
L’IA peut être capable de générer du texte, mais elle ne sait souvent pas écrire correctement dans une image. Dans de nombreux cas, l’art IA qui incorpore de l’écriture aura l’air bizarre. Parfois, il s’agit d’un logo qui ressemble à son homologue dans le monde réel, mais qui n’y parvient pas entièrement. (Vous pouvez dire qu’il essaie de dire Coca-Cola, mais toutes les lettres sont mélangées.) D’autres fois, cela ressemble à quelqu’un qui tente de créer une langue, ou à la façon dont il est de lire quelque chose dans un rêve. (En fait, beaucoup de ces images IA dégagent une qualité onirique, du moins pour moi.)
Maintenant, ce côté de l’art IA s’améliore rapidement. Tant DALL-E que Meta IA ont pu générer une image d’un gâteau avec l’inscription “HAPPY BIRTHDAY KAREN” sans aucun problème horrifique. Cela dit, celle de Meta n’était pas parfaite : le second “P” dans “HAPPY” ressemblait davantage à un “Y”, tandis que le “A” dans “KAREN” avait deux lignes au lieu d’une. Mais il est important de noter que ces images sortent mieux lorsque vous demandez spécifiquement à l’IA de les écrire : lorsqu’on la laisse à ses propres moyens, l’écriture a souvent l’air étrange, donc si celui qui a créé l’image n’a pas pensé à corriger cela, cela peut être un signal évident.

Crédit : Jake Peterson/OpenAI
Recherchez des éléments qui n’ont tout simplement pas de sens
En fin de compte, l’art IA ne sait pas vraiment quoi que ce soit. Il produit de l’art basé sur les relations qu’il a établies à partir de toutes ses données d’entraînement. Il ne sait pas comment un bâtiment est réellement censé être construit, comment le tennis se joue, ou comment une main humaine se déplace. Il tire de ses entraînements pour reproduire ces demandes du mieux qu’il peut. Si vous regardez de près, vous pouvez voir ces lacunes de connaissance apparaître dans les œuvres d’art IA, surtout dans les images avec beaucoup d’éléments.
Prenez cette image, par exemple : j’ai demandé à DALL-E de générer une image d’une fête de sous-sol, avec des gens jouant au beer pong, buvant dans des gobelets rouges en plastique, et discutant. Dès le début, il y a des problèmes majeurs : les yeux des personnes dans le cadre sont principalement mal orientés ; la main de l’homme jouant au beer pong est déformée ; et pourquoi jette-t-il des balles de ping-pong depuis le côté de la table ? En parlant de la table, elle est ondulée et se déforme d’une manière qu’une vraie table ne le ferait pas, et il y a deux ensembles de gobelets d’un côté de la table pour une raison quelconque.
Regardez vers l’arrière-plan, et les choses deviennent encore plus étranges. Un homme semble être à genoux, buvant de son gobelet rouge comme s’il s’agissait d’une bouteille. L’homme derrière lui semble avoir une canette bleue dans son gobelet rouge, comme si le gobelet était un porte-gobelet. La personne derrière lui semble avoir son visage retouché, flou comme en est le sujet.

Crédit : Jake Peterson/OpenAI
Même des exemples officiels provenant des entreprises qui fabriquent ces outils présentent ces incohérences logiques. OpenAI a une image drôle d’un avocat chez un thérapeute pour illustrer DALL-E 3.

Crédit : OpenAI
L’avocat a un noyau évidé et se plaint au thérapeute, qui est une cuillère, de se sentir vide à l’intérieur. C’est une bonne blague, mais regardez le bloc-notes du thérapeute : il écrit dessus à l’envers, avec les pages face à l’extérieur. DALL-E a vu suffisamment d’images de thérapeutes pour savoir quels outils ils écrivent normalement sur leurs notes, mais ne comprend pas que nous, les humains, écrivons généralement sur du papier, et non sur un tableau.
Bien sûr, les publications AI qui deviennent virales sur des sites de réseaux sociaux comme Facebook n’ont souvent aucun sens. Qui construit des sculptures de chats en Oreos ? Pourquoi y a-t-il tant d’artistes tristes faisant des châteaux de sable de Jésus ? L’art peut être imaginatif, mais l’art IA est particulièrement étrange, tant dans les petits détails que dans les grands thèmes.
L’éclat de l’IA
Après avoir regardé des images IA pendant un certain temps, vous commencez à remarquer quelque chose de particulier, surtout parmi les images photoréalistes : tout est brillant. Les images IA présentent souvent ce que certains appellent “l’éclat de l’IA”, une brillance qui peut trahir les origines de l’image si vous savez ce que vous cherchez. Les images sont souvent surexposées, ou présentent un éclairage dramatique, ce qui rend les sujets particulièrement lumineux.
Après un certain temps, vous regardez une photo comme celle ci-dessous et vous savez instantanément qu’elle a été réalisée avec l’IA, juste à cause de son apparence. (Même si les mains du sujet n’étaient pas erronées, également.)

Crédit : Jake Peterson/OpenAI
Adoptez un niveau sain de scepticisme
Bien que ces conseils puissent être pertinents aujourd’hui, la technologie de l’IA continue de progresser et de s’améliorer, et pourrait rendre ces conseils obsolètes dans un avenir proche. L’IA est déjà meilleure en écriture, alors qui peut dire qu’elle ne va pas trouver un moyen de générer des mains réalistes à chaque fois ? Ou d’empêcher les éléments de l’image de se mêler ? Ou d’arrêter d’ajouter des éléments étranges aux arrière-plans des images ? Et bien que les conseils ci-dessus soient actuellement utiles pour les images photoréalistes, il peut être plus difficile d’identifier les œuvres générées par l’IA : ces pièces peuvent avoir les mêmes défauts que ceux mentionnés ci-dessus, mais il est plus facile de cacher ces incohérences avec de la “peinture”, qui est souvent mélangée, moins réaliste et plus ouverte à l’interprétation.
Alors que nous entrons dans une année électorale particulièrement turbulente, il sera plus important que jamais d’aiguiser votre radar de désinformation en naviguant sur Internet. Avant d’être impressionné par l’art complexe de quelqu’un, ou en colère par une image choquante, réfléchissez à deux fois : cette image est-elle même réelle ?