Deux jugements récents rendus à quelques jours d’intervalle par deux juges différents du tribunal de district du nord de la Californie ont établi que l’utilisation d’œuvres protégées par le droit d’auteur aux fins d’entraînement de grands modèles de langage (GML) constituait une utilisation équitable1. La conclusion selon laquelle l’utilisation d’œuvres pour entraîner les GML était profondément transformatrice et que les GML ne mettaient pas à la disposition du public une part significative des œuvres originales s’est révélée déterminante dans les deux décisions.

Même si les deux juges ont finalement conclu que l’utilisation équitable s’appliquait, leurs analyses respectives laissent penser que leurs opinions ont divergé sur trois questions relatives à cette doctrine : i) l’existence ou non d’un objectif transformateur distinct à l’entraînement d’un GML, ii) l’importance de l’utilisation de copies piratées et iii) l’effet de la reproduction sur le marché. Ces premières décisions sur le sujet pourraient créer une divergence dans la façon dont les tribunaux analysent l’utilisation équitable en ce qui a trait à l’entraînement de l’IA.

Dans la première partie de cette série, nous résumons les principales conclusions de la décision du juge Alsup dans la cause Bartz v Anthropic. Dans la deuxième partie, nous discuterons de la décision du juge Chhabria dans la cause Kadrey v Meta. Enfin, dans la troisième partie, nous comparerons ces deux affaires et établirons des liens avec l’exception canadienne relative à l’utilisation équitable dans le contexte de l’entraînement de l’IA.


Contexte

Dans la décision Anthropic, trois auteurs d’œuvres littéraires ont intenté une action collective au motif que leurs droits d’auteur avaient été violés dans le cadre de l’entraînement par Anthropic de son service logiciel d’IA, appelé « Claude ». Pour entraîner Claude, Anthropic avait téléchargé des millions d’œuvres littéraires piratées. La société avait également acheté des millions d’œuvres littéraires en format papier pour ensuite les numériser, avant de détruire les originaux. Elle avait créé une bibliothèque centrale à partir de toutes ces copies d’œuvres, puis sélectionné divers sous-ensembles d’œuvres piratées et numérisées dans cette bibliothèque afin d’entraîner les GML utilisés par Claude. Elle avait également conservé toutes les copies de la bibliothèque centrale en vue d’éventuelles futures utilisations.

Avant l’autorisation de l’action collective, Anthropic a présenté une requête en jugement sommaire à l’égard de sa défense d’utilisation équitable.

Dans sa requête, Anthropic a fait valoir qu’elle avait copié les œuvres des auteurs à une seule et unique fin : entraîner ses GML. Les auteurs ont quant à eux soutenu qu’Anthropic avait copié les œuvres en vue de deux utilisations : non seulement entraîner ses GML mais également bâtir une grande bibliothèque centrale dont le contenu pourrait se révéler utile. Le juge Alsup a examiné les deux utilisations et les deux ensembles d’œuvres (les œuvres littéraires piratées et celles en format papier numérisées) et leur a appliqué les quatre facteurs d’utilisation équitable énoncés à l’article 107 de la Copyright Act.

Ses trois conclusions principales sont énoncées ci-après.

L’utilisation d’œuvres aux fins d’entraînement des GML constitue une utilisation équitable 

Le juge Alsup a estimé que l’utilisation d’œuvres aux fins d’entraînement des GML constituait une utilisation équitable. Le fait que l’utilisation d’œuvres pour entraîner l’IA était profondément transformatrice et qu’aucune copie des œuvres n’avait été mise à la disposition du public s’est révélé déterminant dans son analyse. Comme il l’a reconnu lui-même [TRADUCTION] : « Si les textes de sortie vus par les utilisateurs avaient porté atteinte au droit d’auteur, l’affaire portée par les auteurs aurait été toute autre2. »

Le juge Alsup a également estimé que l’utilisation des œuvres aux fins d’entraînement des GML ne toucherait pas le marché concerné. Tout d’abord, il a rejeté l’argument selon lequel l’entraînement des GML donnerait lieu à une prolifération d’œuvres concurrentes. Selon lui, [TRADUCTION] « la revendication des auteurs est du même acabit que celle qu’ils pourraient formuler face à des élèves qui apprendraient à bien rédiger, au motif qu’il en résulterait une prolifération d’œuvres concurrentes3 ». Ensuite, il a rejeté l’affirmation des auteurs selon laquelle la violation du droit d’auteur limiterait leur marché d’octroi de licences aux fins d’entraînement des GML, constatant qu’un marché potentiel d’octroi de licences ne faisait pas partie des marchés que la Copyright Act donnait aux auteurs le droit d’exploiter4.

L'utilisation d’œuvres numériques pour créer une bibliothèque centrale constitue une utilisation équitable

La numérisation par Anthropic des œuvres littéraires des auteurs afin d’alimenter sa bibliothèque centrale constituait une utilisation équitable. Le facteur crucial sous-tendant cette conclusion était qu’Anthropic avait acheté légalement ces copies en format papier avant de les numériser et avait donc déjà le droit de les conserver dans sa bibliothèque.

L’utilisation d’œuvres piratées pour créer une bibliothèque centrale ne constitue pas une utilisation équitable

Le juge Alsup a fait la distinction entre l’utilisation d’œuvres piratées et celle d’œuvres numérisées aux fins de l’alimentation d’une bibliothèque centrale. Il a estimé que la création d’une bibliothèque centrale à partir d’œuvres numérisées constituait une utilisation équitable, mais que l’utilisation d’œuvres piratées à la même fin ne l’était pas [TRADUCTION] : « Le piratage de copies dans l’optique de bâtir une bibliothèque de recherche sans les avoir payées et de les conserver au cas où elles se révéleraient utiles d’une manière ou d’une autre constitue une utilisation en soi, et non une utilisation transformatrice5. » Le fait que les copies piratées « aient manifestement détourné la demande à l’égard des œuvres littéraires des auteurs pour chaque copie » et auraient pu être obtenues légalement a occupé une place centrale dans l’analyse du juge Alsup6.

Conclusion

En concluant que l’utilisation des œuvres pour entraîner les GML constituait une utilisation équitable, le juge Alsup n’a fait aucune distinction entre les copies numérisées et les copies piratées, contrairement à ce qu’il a établi dans son analyse sur la bibliothèque centrale. Ainsi, il semblerait que l’utilisation des copies piratées et non piratées aux fins d’entraînement des GML ait été considérée comme une utilisation équitable. Toutefois, ailleurs dans sa décision, le juge Alsup a également indiqué qu’il doutait que l’utilisation d’œuvres piratées à quelque fin que ce soit (y compris l’entraînement d’un GML) puisse un jour être considérée comme une utilisation équitable7. En somme, il s’est concentré sur le fait que les copies piratées avaient en tout état de cause été également utilisées aux fins de création d’une bibliothèque centrale (ce qui ne constituait pas une utilisation équitable). La question de l’utilisation des copies piratées aux fins de création d’une bibliothèque centrale sera instruite à la prochaine étape de la procédure.

Somme toute, une certaine incertitude persiste concernant la façon dont les copies piratées seront traitées dans le cadre de l’analyse de l’utilisation équitable si elles sont uniquement utilisées aux fins restreintes de l’entraînement d’un GML. Dans la prochaine actualité juridique de notre série, nous nous pencherons sur la cause Kadrey v Meta, dont la décision a été rendue quelques jours après celle de Anthropic et qui traite également de la question de savoir si l’utilisation de copies non autorisées aux fins d’entraînement d’un GML constitue une utilisation équitable.


Notes

1  

Bartz et al v Anthropic, 3:24-cv-05417-WHA; Kadrey v Meta Platforms, Inc., 3:23-cv-03417-VC.

2  

Anthropic, p. 12.

3  

Anthropic, p. 28.

4  

Anthropic, p. 28.

5  

Anthropic, p. 19.

6  

Anthropic, p. 29.

7  

Anthropic, p. 18-19.



Publications récentes

Abonnez-vous et restez à l’affût des nouvelles juridiques, informations et événements les plus récents...