Copyright vs Technologie : L’IA en première ligne

Carolina Rambaldi
Double Diplôme en Droit – King’s College et Assas

Dans une époque marquée par les avancées technologiques, la rencontre entre intelligence artificielle et droits de propriété intellectuelle est devenue source de contentieux juridique. L’utilisation d’œuvres protégées par ces droits dans les données d’entraînement, essentielle pour des modèles d’IA tels que ChatGPT, a suscité de nombreux questionnements.

Aux Etats-Unis, les récentes poursuites engagées par le New York Times contre OpenAI en sont un exemple frappant, mettant en lumière la difficulté qu’est de trouver un équilibre entre innovation et protection des droits de propriété intellectuelle.  Dans ce litige, le NYT dénonce l’utilisation d’OpenAI de contenu légalement protégé sans licence appropriée. Le New York Times dénonce également le phénomène de “régurgitation”, dans lequel le modèle ChatGPT d’OpenAI génère du texte recopiant intégralement des articles du Times. OpenAI réfute ces accusations. Pour la société en plein essor, ce phénomène de régurgitation est un « bug rare » faisant l’objet d’efforts actifs afin de les minimiser ; OpenAI affirme en outre que que le Times aurait manipulé les requêtes pour induire ces cas . Malgré la défense d’OpenAI, le New York Times soutient que cette violation présumée affecte négativement le journal sur le plan financier, réclamant des dommages pouvant atteindre un la somme de 450 milliards de dollars.

L’affaire OpenAI NYT n’est pas unique et se fond dans une tendance plus large dans laquelle auteurs et artistes engagent de manière croissante des poursuites contre les développeurs d’IA. Un autre exemple serait celui de la société Getty Images intentant un procès contre  Stability AI pour l’utilisation de photos protégées par le droit d’auteur dans son modèle génératif Stable Diffusion. Ces tensions dessinent un paysage complexe dans lequel le développement de l’intelligence artificielle entre en conflit avec les droits de propriété intellectuelle, soulevant d’importantes questions juridiques et éthiques.

I – Action législative : nécessaire ou prématurée ?

Certaines personnes détenant des droits de propriété intellectuelle ou encore des groupes industriels demandent une action de la part du Congrès américain, proposant des modèles de licences statutaires ou collectives. D’autres suggestions incluent d’obliger les développeurs d’IA à divulguer des informations protégées par le secret des affaires concernant leurs modèles et processus d’entraînement.

Cependant, selon les fournisseurs de technologie IA, la mise en œuvre de ces propositions, bien qu’ayant pour objectif de pallier aux inquiétudes légitimes liées à la protection des droits de propriété intellectuelle, est prématurée. Le développement de l’IA générative repose sur l’utilisation  d’ensembles de données vastes et diversifiés, essentiels pour des performances précises et impartiales des modèles. Imposer un strict régime d’obtention de licences pour l’utilisation des données aurait des conséquences drastiques sur l’activité des développeurs, qui devraient alors identifier toutes les personnes détenant des droits sur les informations, en particulier pour les œuvres extraites du vaste réseau global. En outre, l’obligation de divulgation des ensembles de données rencontrerait des obstacles pratiques, car les données en ligne, d’origine diverse et publiquement disponibles, n’ont pas de sources bien définies. De plus, OpenAI soutient que des initiatives récentes, telles que des contrôles renforcés des éditeurs Web, rendent les exigences de divulgation proposées obsolètes, et ont pour effet de donner aux titulaires de droits le pouvoir de déterminer ex ante si leur contenu en ligne peut être utilisé à des fins d’entraînement. Parmi ces initiatives récentes figurent l’adoption de standards tels que le protocole ‘Robots Exclusion Protocol’ (REP), qui permet aux éditeurs de spécifier les parties de leur site web pouvant être explorées par les robots d’indexation, et l’introduction de balises méta spécifiques, telles que ‘noindex’ et ‘nofollow’, qui offrent aux éditeurs la possibilité de restreindre l’accès ou l’utilisation de leurs contenus par des algorithmes d’IA. De plus, l’émergence de plateformes d’attribution et de licences numériques, telles que les licences Creative Commons, facilite pour les titulaires de droits la gestion et la communication de leurs préférences concernant l’utilisation de leurs œuvres par des tiers, notamment dans les processus d’entraînement des modèles d’intelligence artificielle

De plus, il a été fait valoir que l’implémentation de modèles de licences constituerait une menace significative pour l’innovation, affectant de manière disproportionnée les start-ups et nouveaux entrepreneurs dépourvus de ressources financières pour des licences étendues. Cela pourrait conduire à la concentration du marché, limitant la concurrence et entravant le progrès technologique.

II – Le critère du ‘Fair Use’ 

Analyser la « Fair Use doctrine », ou « doctrine de l’utilisation équitable » dans le contexte de l’affaire NYT c. OpenAI est crucial, en ce qu’elle constitue la base juridique équilibrant les intérêts des détenteurs de droits et ceux liés à l’innovation.

La doctrine de l’utilisation équitable, principe juridique américain permettant une utilisation limitée de contenu protégé par les droits d’auteur sans autorisation, pose des critères spécifiques permettant de considérer l’utilisation de contenu comme étant acceptable. Codifiée par le Congrès américain en 1976, cette doctrine énonce quatre facteurs à considérer par les tribunaux afin de juger de l’utilisation équitable d’un contenu déposé. 

  1. Le but et le caractère de l’utilisation 

Le premier critère de la doctrine de l’utilisation équitable est celui du but et du caractère de l’utilisation et évalue si l’utilisation est commerciale ou à but non lucratif et dans quelle mesure elle ajoute une dimension nouvelle et transforme l’œuvre originale. Les utilisations à but non lucratif et transformantes, telles que celles à des fins éducatives, de critique, de commentaire ou de parodie, sont généralement plus susceptibles d’être considérées comme appartenant à l’utilisation équitable de contenu. En revanche, l’utilisation principalement commerciale ne transformant pas significativement l’œuvre originale jouera en défaveur d’une qualification d’utilisation équitable. Une utilisation transformative implique de réutiliser le matériel protégé par le droit d’auteur en ajoutant un nouveau sens ou contexte, contribuant au progrès des sciences et des arts.

Un exemple emblématique de ce premier critère est l’affaire Google Books, dans laquelle le tribunal a jugé que la création par Google d’un index de recherche de livres était transformative. En fournissant des informations sur les livres sans s’y substituer, l’utilisation faite par Google servait l’intérêt général, favorisant ainsi une décision en faveur de l’utilisation équitable. Cette affaire souligne l’importance de l’utilisation transformative d’un contenu déposé pour améliorer le savoir et l’accessibilité, s’alignant donc sur l’objectif poursuivi par la doctrine de l’utilisation équitable qui est de favoriser l’innovation et la diffusion d’informations. 

De manière similaire, l’affaire Andy Warhol souligne l’importance, dans le premier critère, de caractériser l’objectif  ou le caractère différent de l’utilisation de contenu, et, sinon, s’il existe un motif de justification de la copie. Le tribunal a analysé l’utilisation par Warhol de l’image du chanteur Prince, afin de déterminer si elle partageait le même but que la photographie originale ou offrait une nouvelle interprétation. Cette affaire met en évidence l’évaluation nuancée de l’utilisation transformative, dans laquelle un but ou caractère différent, couplé à une justification pour la copie, peut pousser vers la qualification d’utilisation équitable.

  1. La nature de l’oeuvre protégée par le droit d’auteur 

Le deuxième critère de la doctrine de l’utilisation équitable examine la nature inhérente de l’œuvre protégée par le droit d’auteur. Il évalue si l’œuvre correspond aux objectifs du droit d’auteur visant à promouvoir la créativité et l’innovation, ou si elle s’éloigne de ces buts. Plus précisément, ce facteur prend en compte le degré d’originalité, de créativité et d’effort intellectuel impliqué dans la création de l’œuvre, qui sont des indicateurs clés de son importance et de sa contribution à la richesse culturelle, éducative ou informationnelle de la société. Les œuvres qui incarnent un haut degré de ces qualités sont considérées comme plus « centrales et essentielles » à l’esprit de la protection du droit d’auteur, méritant ainsi une défense plus forte contre l’utilisation non autorisée. À l’inverse, les œuvres présentant des degrés moindres d’originalité, de créativité et d’effort intellectuel peuvent être vues comme périphériques, justifiant une approche plus flexible des considérations d’utilisation équitable. Ce critère permet de déterminer le niveau de protection variable nécessaire à différentes œuvres, influençant la qualification d’utilisation équitable ou non.

Une affaire importante illustrant ce facteur est celle d’Harper & Row Publishers, Inc. v. Nation Enterprises (1985), dans laquelle la Cour Suprême a pu analyser le niveau de protection à conférer à la publication d’extraits du mémoire de l’ancien Président Ford par le magazine “The Nation”. La Cour a souligné que la nature inédite de l’œuvre méritait une protection du droit d’auteur accrue, soulignant l’importance du statut de publication de l’œuvre et de sa nature créative dans l’analyse de l’utilisation équitable.

  1. La quantité ou la substantialité de la portion utilisée

Le troisième critère de la doctrine de l’utilisation équitable évalue la quantité et l’importance de la partie de l’œuvre protégée par le droit d’auteur utilisée par rapport à l’œuvre dans son ensemble. Il examine si l’utilisation de l’œuvre originale est raisonnable et limitée ou si elle va au-delà de ce qui est nécessaire à l’objectif poursuivi, en comparant la proportion de l’œuvre utilisée et son importance par rapport à l’ensemble du contenu protégé par le droit d’auteur.

L’affaire Kelly v. Arriba Soft Corporation (2003) illustre parfaitement ce troisième critère. Le cas concernait l’utilisation d’images miniatures par un moteur de recherche. Le tribunal a considéré que, malgré l’utilisation intégrale des images afin d’en faire des miniatures, la quantité et la substantialité étaient considérées comme minimales et fonctionnelles. Cette décision peut être expliquée par l’utilisation transformative des images pour un outil d’indexation de recherche, démontrant comment ce critère a pour objectif d’évaluer non seulement la quantité mais aussi l’importance qualitative du matériel protégé par le droit d’auteur utilisé.

  1. L’effet de l’utilisation sur le marché potentiel ou la valeur de l’œuvre

Le quatrième critère de la doctrine de l’utilisation équitable évalue l’impact de l’utilisation sur le marché potentiel de l’œuvre protégée par le droit d’auteur ou sa valeur. Il examine si l’utilisation aurait vocation à servir de substitut à l’œuvre originale, affectant ainsi son intérêt commercial. Si l’utilisation vient à diminuer le marché de l’œuvre originale, il sera plus difficile de qualifier l’utilisation équitable du contenu ; à l’inverse, utilisation n’affectant pas significativement le marché permettra de soutenir qu’il s’agit bien d’une d’utilisation équitable. Ainsi, ce facteur prend en compte les implications économiques de l’utilisation sur l’œuvre originale et son impact potentiel sur le marché.

Dans Campbell v. Acuff-Rose Music, Inc. (1994), la Cour Suprême a évalué la parodie de la chanson “Oh, Pretty Woman” de Roy Orbison par 2 Live Crew et ses conséquences sur le marché de l’œuvre originale. La Cour a reconnu la parodie comme étant une utilisation transformative ayant vocation à attirer un marché différent de l’œuvre originale, permettant de conclure que la parodie ne nuisait pas nécessairement au marché de la chanson originale. Cette affaire illustre la prise en compte par le quatrième critère de l’usurpation potentielle du marché par la nouvelle utilisation de l’œuvre protégée, ainsi que son impact économique.

III – Arguments d’OpenAI 

OpenAI soutient que l’utilisation de contenu pour entraîner des modèles d’IA générative, comme sa propre plateforme ChatGPT, est conforme à la doctrine d’utilisation équitable : contrairement à la reproduction de contenu à des fins de communication expressive, la reproduction intermédiaire à des fins d’entraînement des modèles d’IA sert l’objectif d’analyser les concepts sous-jacents, les méthodes, les faits et les modèles. Ce processus est comparé à l’apprentissage humain : les individus sont autorisés à tirer des connaissances de contenus protégés par les droits d’auteur.

De plus, les entreprises technologiques avancent que le processus d’entraînement implique la mise à jour de paramètres permettant de prédire le mot suivant, utilisant des liens entre des éléments échappant à la portée des droits d’auteur, plutôt que de reproduire un contenu expressif. Le droit d’auteur aurait vocation à protéger l’expression des idées plutôt que les idées elles-mêmes ou les faits : les aspects fonctionnels, les procédures et les concepts sont généralement considérés comme non protégeables. En d’autres termes, le seuil de protection par les droits d’auteur serait l’originalité et la créativité, et tous les éléments ou informations ne bénéficient pas automatiquement d’une protection de droits d’auteur. De ce fait, l’argument avancé est que le processus d’entraînement, qui reproduit à des fins d’analyse statistique, est une étape intermédiaire visant à extraire des éléments non protégeables de l’ensemble des œuvres. Par conséquent, l’utilisation de l’œuvre protégée par le droit d’auteur est non expressive, sans rapport avec le but expressif original, et sert à la création de contenus entièrement nouveaux.

Selon ces arguments, cet aspect transformateur est conforme aux à la doctrine d’utilisation équitable, tout en favorisant l’innovation et en créant du contenu nouveau.

Alors que les tribunaux examinent les affirmations d’OpenAI concernant l’utilisation transformative dans l’entraînement des modèles d’IA générative par rapport aux allégations du New York Times, le verdict aura non seulement un impact sur cette affaire, mais façonnera également la trajectoire du développement mondial de l’IA et son interaction avec les droits d’auteur. Les questions juridiques et éthiques profondes émergeant de ces conflits reflètent les défis et opportunités à venir dans un contexte technologique à l’évolution rapide. Ces questions exigent un examen approfondi de de la relation entre l’IA et la propriété intellectuelle et de leurs cadres juridiques.

  1.  Michael M. Grynbaum, Ryan Mac ‘The Times sues OpenAI and Microsoft over A.I. use of copyrighted work’ The New York Times (27 December 2023)
  2.  Emilia David, ‘OpenAI claims The New York Times tricked ChatGPT into copying its articles’ The Verge (8 Jan 2024) <https://www.theverge.com/2024/1/8/24030283/openai-nyt-lawsuit-fair-use-ai-copyright>  
  3.  Adam Clark Estes, ‘A New York Times copyright lawsuit could kill OpenAI’ (Vox, 18 Jan 2024) <https://www.vox.com/technology/2024/1/18/24041598/openai-new-york-times-copyright-lawsuit-napster-google-sony>
  4.  Getty Images v Stability AI [2023] EWHC 3090 (Ch)
  5.  Meta Platforms, Inc., ‘Comments on Notice of Inquiry on Artificial Intelligence & Copyright (Dkt. 2023-6)’ (US Copyright Office, 30 October 2023)
  6. Bruce Clay ‘Robots Exclusion Protocol Guide’ <https://www.bruceclay.com/wp-content/uploads/2022/03/bruceclayinc-robots-exclusion-guide-2022.pdf>
  7.  Moz ‘Robots Meta Directives’ <https://moz.com/learn/seo/robots-meta-directives>
  8.  Kat Walsh ‘Understanding CC licenses and generative AI’ <https://creativecommons.org/2023/08/18/understanding-cc-licenses-and-generative-ai/>
  9.  Microsoft and GitHub, ‘Response to Notice of Inquiry and Request for Comment re Artificial Intelligence and Copyright [Docket No. 2023-06]’ (2023)
  10.  17 U.S.C. § 107
  11.  The Authors Guild Inc. v. al. v. Google Inc. (2nd Cir. 2015) 804 F.3d 202
  12.  The Andy Warhol Foundation for the Visual Arts, Inc. v. Goldsmith, 2021 143 S. Ct. 1258
  13.  471 U.S. 539 (1985)
  14.  336 F.3d 811 (9th Cir. 2003)
  15.  510 U.S. 569 (1994)
  16.  Anthropic, ‘Response to the Copyright Office’s Notice of Inquiry on Copyright and Artificial Intelligence [Docket No. 2023-6]’ (2023)
  17.  Google LLC, ‘Comments in Response to Notice of Inquiry, “Artificial Intelligence and Copyright”’, 88 Fed. Reg. 59942 (COLC-2023-0006) (30 October 2023)
Share this article
Shareable URL
Prev Post

La Legaltech au coeur de l’actualité #174

Next Post

La Legaltech au cœur de l’actualité #175