Les modèles d’IA générative ne naissent pas dans le vide. En un sens, ces systèmes sont construits pièce par pièce à l’aide de vastes quantités de données d’entraînement et ont toujours besoin de plus d’informations pour continuer à s’améliorer. À mesure que la course à l’IA s’intensifie, les entreprises font tout ce qu’elles peuvent pour alimenter leurs modèles avec plus de données—et beaucoup utilisent nos données pour le faire, parfois sans demander notre autorisation explicite au préalable.
LinkedIn est le dernier apparent coupable de cette pratique : il semble que la “plateforme” de médias sociaux axée sur la carrière préférée de tous utilise nos données pour entraîner ses modèles d’IA sans demander de permission ou divulguer la pratique au départ. Joseph Cox de 404Media a d’abord rapporté l’histoire, mais il n’est pas nécessaire d’être journaliste pour enquêter soi-même.
Ce Tweet est actuellement indisponible. Il pourrait être en train de charger ou a été supprimé.
Il suffit d’aller sur LinkedIn, de cliquer sur votre profil et d’aller dans Paramètres & Confidentialité > Confidentialité des données. Ici, vous remarquerez un champ intéressant : Données pour l’amélioration de l’IA générative. Ce paramètre demande : “LinkedIn et ses affiliés peuvent-ils utiliser vos données personnelles et le contenu que vous créez sur LinkedIn pour entraîner des modèles d’IA générative qui créent du contenu ?” Oh, qu’est-ce que c’est ? C’est réglé sur Activé par défaut ? Merci de demander, LinkedIn.
À quoi LinkedIn utilise-t-il vos données ?
Si vous cliquez sur le lien En savoir plus, vous verrez l’explication de LinkedIn sur ce qu’il fait avec vos données. Lorsque cette option est activée, vos données de profil et le contenu de vos publications peuvent être utilisés pour entraîner ou “affiner” les modèles d’IA générative de LinkedIn et de ses affiliés. Qui sont ces affiliés ? Eh bien, LinkedIn dit que certains de leurs modèles sont fournis par Azure OpenAI de Microsoft, mais ils n’élaborent pas au-delà de cela, autant que je puisse le dire.
La société souligne dans cette explication qu’uniquement les modèles d’IA entraînés pour générer du contenu, comme son assistant d’écriture alimenté par IA, utilisent vos données, plutôt que les modèles d’IA responsables de la personnalisation de LinkedIn par utilisateur, ou ceux utilisés pour la sécurité. Elle dit également qu’elle vise à “minimiser” les données personnelles utilisées pour les ensembles d’entraînement, y compris en utilisant des “technologies de protection de la vie privée” pour obscurcir ou retirer les données personnelles de ces bases de données, mais ne précise pas comment cela se fait ni dans quelle mesure. Cela dit, elle propose un formulaire pour faire valoir son choix de ne pas utiliser vos données pour “des modèles GAI non générant de contenu.” Alors, qu’est-ce que c’est, LinkedIn ?
Fait intéressant, Adobe avait l’approche opposée lorsque les utilisateurs se sont plaints de sa politique d’accès au travail des utilisateurs pour entraîner des modèles d’IA : ils étaient catégoriques que les données utilisateur n’étaient pas utilisées pour des modèles d’IA générative, mais pour d’autres types de modèles d’IA. Quoi qu’il en soit, ces entreprises ne semblent pas comprendre que les gens préféreraient que leurs données soient omises de tous les ensembles d’entraînement de l’IA—surtout lorsqu’ils n’ont pas été consultés à ce sujet au départ.
LinkedIn dit qu’il conserve vos données aussi longtemps que vous le faites : Si vous supprimez vos données de LinkedIn, soit en supprimant une publication ou via l’outil d’accès aux données de LinkedIn, la société les supprimera de son côté et ainsi cessera de les utiliser pour l’entraînement de l’IA. La société précise également qu’elle n’utilise pas les données des utilisateurs dans l’UE, l’EEE ou la Suisse.
À mon avis, cette pratique est ridicule. Je pense qu’il est inacceptable d’opter vos utilisateurs dans l’entraînement de modèles d’IA avec leurs données sans leur présenter l’option d’abord, avant même de mettre à jour les conditions d’utilisation. Je me fiche que des lois sur la protection des données peu strictes permettent aux entreprises comme LinkedIn de conserver tout ce que nous postons ou téléchargeons sur leurs plateformes : si vous souhaitez utiliser la publication de quelqu’un pour améliorer votre bot d’écriture, demandez-leur d’abord.
Que pensez-vous jusqu’à présent ?
J’ai contacté LinkedIn, en demandant spécifiquement des éclaircissements sur certaines incohérences dans sa politique, et pour savoir depuis combien de temps ce processus est en cours. La société a répondu à mes demandes avec un lien vers une page décrivant les mises à jour de leur accord utilisateur et politique de confidentialité, mais le premier semble ne pas être mis à jour pour le moment. LinkedIn dit que les changements supposés entreront en vigueur le 20 novembre, mais l’accord utilisateur actuel date de 2022. De plus, les articles d’assistance auxquels j’ai fait référence dans ce document ont été mis à jour il y a sept jours au moment de la rédaction.
Comment se désinscrire de l’entraînement de l’IA de LinkedIn
Pour continuer à utiliser LinkedIn sans transmettre vos données pour former ses modèles d’IA, retournez dans Paramètres & Confidentialité > Confidentialité des données > Données pour l’amélioration de l’IA générative. Ici, vous pouvez cliquer sur le commutateur pour mettre Désactivé et vous désinscrire. Vous pouvez également utiliser ce formulaire pour “s’opposer ou demander la restriction” du traitement de vos données pour “des modèles GAI non générant de contenu.”
Cela n’est pas rétroactif : tout entraînement qui a déjà eu lieu ne peut être annulé, donc LinkedIn ne retirera pas les effets de l’entraînement de vos données de ses modèles.
Lorsque vous vous désinscrivez, vos données peuvent toujours être utilisées pour traiter l’IA, mais uniquement lorsque vous interagissez avec les modèles d’IA : LinkedIn dit qu’il peut utiliser vos entrées pour traiter votre demande et inclure toutes les données de cette entrée dans la sortie de l’IA, mais c’est simplement comme ça que fonctionnent les modèles d’IA. Si LinkedIn ne pouvait pas accéder à ces données après que vous vous êtes désinscrit, le modèle serait en grande partie inutile.