mai 13, 2024

La loi sauvera-t-elle la publicité de l’IA ?

Si l’IA est entraînée sur du matériel protégé par le droit d’auteur et que les agences l’utilisent pour générer un travail créatif, les agences sont-elles coupables de violation du droit d’auteur ?

La façon dont les agences et les clients parlent de l’IA a pris une tournure récente qui place les questions juridiques liées au droit d’auteur au premier plan de la discussion. En bref, l’argument est qu’étant donné que de nombreuses plateformes d’IA sont formées sur du matériel protégé par le droit d’auteur (au moins potentiellement), le produit du travail de ces systèmes ne peut pas être considéré comme juridiquement valable. En d’autres termes, le texte et les images générés par les systèmes d’IA peuvent cacher une violation du droit d’auteur. Il n’est donc pas sûr d’utiliser des textes ou des images générés par des plateformes d’IA à des fins commerciales.

Pour leur part, les plateformes d’IA telles que Google, Adobe et Microsoft se sont jusqu’à présent engagées à assumer les conséquences juridiques de toute action intentée contre les utilisateurs de leurs produits. Cet engagement est susceptible de changer et ne s’applique qu’aux cas de violation accidentelle des droits d’auteur, mais il est audacieux de leur part. Pourquoi se sentent-ils si confiants ?

Comment fonctionne l’IA

Pour comprendre pourquoi ces grands acteurs de la technologie sont si effrontés dans leur approche du droit d’auteur, il convient d’expliquer comment fonctionnent les modèles d’IA.

Les grands modèles de langage et les outils de génération d’images sont des systèmes statistiques. En leur fournissant d’énormes quantités de données d’exemple (des milliards de pages de texte ; des millions d’images), nous pouvons entraîner les algorithmes d’apprentissage automatique à apprendre les modèles qui entrent dans la fabrication de ces actifs. Une fois qu’un générateur d’images a consommé des millions de photos d’une voiture, il peut, en quelque sorte, apprendre quels ingrédients composent le concept d’une voiture et appliquer ces enseignements pour générer de nouvelles voitures crédibles.

L’IA n’a pas besoin de stocker ou d’utiliser directement les données sources pour fonctionner. Au lieu de cela, elle utilise sa formation pour générer de nouveaux actifs qui sont similaires, mais néanmoins entièrement distincts, de tout actif individuel sur lequel elle a été formée.

Le rôle du contenu protégé par le droit d’auteur

Étant donné que bon nombre de ces systèmes ont été formés sur des données disponibles sur l’internet public ainsi que sur d’autres grandes bases de données de contenu (par exemple de grandes bases de données de livres), il est probable qu’au moins une partie du contenu utilisé pour la formation soit protégée par des droits d’auteur. Cela signifie que si ce contenu est utilisé à des fins commerciales, un auteur ou un créateur doit être rémunéré pour sa propriété intellectuelle.

La question est donc la suivante : les œuvres dérivées, à savoir les actifs générés par l’IA, sont-elles soumises à des restrictions en matière de droits d’auteur ?

Utilisation équitable

Dans la plupart des pays du monde, la loi sur le droit d’auteur contient un concept d' »utilisation équitable » qui s’applique au contenu protégé par le droit d’auteur. Un exemple simple est celui de la citation d’un court passage d’un livre dans un ouvrage que vous écrivez. Tant que l’original est cité comme source, il est « équitable » pour un auteur de citer ce passage. Une règle similaire s’applique aux échantillons utilisés par les musiciens dans leur propre musique et dans de nombreux autres cas.

La formation à l’IA est-elle une utilisation équitable ?

La question n’est pas encore tranchée en droit, mais à mon avis, l’issue probable d’un procès sera en faveur de la plateforme technologique. Pourquoi ?

La chose que la plateforme technologique vend pour une utilisation commerciale n’est pas l’œuvre sous-jacente protégée par le droit d’auteur. L’analogie est la suivante : votre enfant apprend la science en regardant National Geographic à la télévision. Il continue ensuite à apprendre et finit par devenir un scientifique, écrire un livre influent et s’enrichir grâce à son succès de librairie. Les titulaires de droits d’auteur de National Geographic ont-ils un droit sur les droits d’auteur du livre de votre enfant devenu adulte ?

Je suis sûr que nous sommes tous d’accord pour dire que non. Pourquoi ? Parce que même si l’émission de télévision originale a pu avoir une influence, voire une influence déterminante, sur les connaissances de cet enfant dans le domaine, il serait impossible de déterminer l’ampleur de cette influence, et ce que nous verrions serait le travail acharné accompli par le nouvel auteur pour comprendre et traiter cet apprentissage et y ajouter son propre point de vue et sa propre articulation. Il peut exprimer sa gratitude envers les gens de National Geographic, mais c’est tout ce que l’on peut raisonnablement attendre de lui.

On pourrait dire : « Eh bien, cet enfant a regardé le National Geographic : « Eh bien, cet enfant a regardé National Geographic sur une chaîne de télévision payante, de sorte que le contenu a été payé quelque part dans l’histoire ». Même si cela est vrai, tout ce que nous disons alors à propos de l’IA, c’est que le propriétaire de la technologie aurait dû baser sa formation sur une copie légale du contenu. La norme est donc qu’il aurait dû acheter une copie des livres sur lesquels il s’est formé ou disposer d’un abonnement valide aux sites d’information qu’il a pu consulter.

Cela semble juste, mais ce n’est pas ce dont la plupart des juristes nous disent de nous inquiéter. Ils semblent sous-entendre que si une œuvre protégée par le droit d’auteur a été utilisée au cours d’une formation, toute œuvre dérivée qui, d’une manière ou d’une autre, a utilisé ce matériel pour générer un résultat devrait, d’une manière ou d’une autre, payer des redevances au détenteur du droit d’auteur.

Cela semble absurde et repose sur un malentendu quant à savoir si l’IA crée un pastiche, un mélange d’œuvres originales, ou si elle crée authentiquement quelque chose de nouveau. Il est évident que c’est ce dernier cas qui se produit. Si vous demandez à Dall-E de créer une voiture verte, elle utilise ce qu’elle a appris sur les voitures et applique des statistiques à ces connaissances pour créer une toute nouvelle voiture. Cette nouvelle voiture n’est pas constituée pour un millionième d’une voiture de Shutterstock et pour un millionième d’une voiture de Getty Images, pas plus qu’on ne peut dire que l’auteur de mon récit ci-dessus utilise un millionième de l’émission du National Geographic. D’une certaine manière, c’est le cas, mais nous comprenons généralement que s’inspirer de quelque chose n’est pas la même chose que de le plagier.

Encore une fois, il s’agit de mon opinion. Il y a de nombreux procès en cours qui créeront un précédent juridique. Mais le simple fait d’envisager les choses sous cet angle rend désespérée l’action intentée par les auteurs individuels ou les détenteurs de droits d’image.

Cela signifie-t-il que tout est gratuit ?

Il est évident que le fait d’exercer une activité commerciale expose les entreprises à des risques. Et lorsqu’il n’y a pas de loi établie, ce risque peut sembler extrême. Il est donc naturel que les entreprises et les agences préviennent leurs équipes que l’utilisation d’outils d’IA pourrait les exposer à de futures poursuites en matière de droit d’auteur.

Mais analysons logiquement ce qui pourrait se passer ici :

A. Rien – les auteurs et les créateurs perdent leur procès et les plateformes technologiques l’emportent.

B. Les détenteurs individuels de droits d’auteur gagnent – les tribunaux considèrent qu’en utilisant, disons, des droits d’auteur, il n’y a pas d’autre solution, Game of Thrones pour entraîner un grand modèle linguistique constitue une violation du droit d’auteur. Il leur est demandé de retirer Game of Thrones de l’ensemble d’apprentissage et de réapprendre leur modèle. Cela affectera peut-être la plateforme de manière négligeable pendant quelques secondes – la suppression d’un travail ne fera aucune différence à ce stade du jeu. Un autre résultat est que OpenAI ou DeepMind pourrait devoir verser à l’écrivain George RR Martin une sorte de règlement sans rien changer.