La société mère de ChatGPT, OpenAI, semble avoir envisagé un moyen de marquer l’empreinte des textes générés par l’IA depuis plus d’un an, selon le Wall Street Journal. Une telle technologie serait un atout pour les enseignants, les chercheurs, et pratiquement toute personne souhaitant s’assurer que ce qu’elle lit provient d’une personne réelle, mais la société craint qu’elle puisse être contournée et que cela nuise à ses activités.
“La technologie capable de détecter un texte écrit par une intelligence artificielle avec 99,9 % de certitude a été débattue en interne pendant deux ans”, écrit le WSJ à propos d’OpenAI, précisant que la technologie est essentiellement prête et fonctionnerait en ajustant le modèle pour suivre un modèle détectable. Le média indique que la société ne pense pas que l’outil de filigrane diminuerait la qualité des résultats de ChatGPT, mais qu’elle s’inquiète que détecter et marquer les textes générés par ChatGPT pourrait dérouter près de 30 % des utilisateurs, qui auraient déclaré à OpenAI qu’ils seraient moins enclins à utiliser ChatGPT si les textes générés étaient filigranés.
En réponse au rapport du WSJ, OpenAI a publié un blog confirmant qu’elle avait étudié le filigrane en interne, mais que même si cela “a été très précis et même efficace contre la falsification localisée, comme le paraphrasage”, il est moins utile avec des textes qui ont été traduits ou reformulés à l’aide d’un modèle externe. Cela est également vulnérable à des piratages comme l’ajout de caractères inutiles puis leur suppression, ce qui, selon OpenAI, rend “trivial le contournement par des acteurs malveillants.”
Comme alternative, la société envisage d’utiliser des métadonnées pour marquer les textes générés par l’IA, ce qu’elle dit avoir l’avantage de “ne pas engendrer de faux positifs”. La société utilise déjà des métadonnées pour marquer les images générées par l’IA, qu’elle a détaillées dans un exemple dans son article de blog.
Quelle que soit la méthode utilisée par la société, la demande pour une solution arrive plutôt tôt que tard est claire. Selon une enquête commandée par le WSJ, “les gens du monde entier soutiennent l’idée d’un outil de détection d’IA par une marge de quatre à un.”
Google utilise déjà le filigrane pour les textes générés par l’IA, comme expliqué lors de cette année Google I/O.