Dans la première partie de notre série sur l’utilisation équitable aux fins d’entraînement de grands modèles de langage (GML), nous avons examiné la décision du juge Alsup dans la cause Bartz v Anthropic, selon laquelle la copie d’œuvres littéraires pour entraîner des GML constituait une utilisation équitable, contrairement à l’utilisation d’œuvres littéraires piratées pour créer une bibliothèque centrale1.
Quelques jours seulement après la publication de la décision Anthropic, une autre décision relative à l’utilisation équitable aux fins d’entraînement de GML a été rendue. Dans la deuxième partie de notre série, nous présentons sommairement les principales conclusions de la décision du juge Chhabria dans la cause Kadrey v Meta2. Restez à l’affût de la troisième partie, dans laquelle nous comparerons les deux décisions et établirons des liens avec le Canada.
Contexte
Dans la cause Meta, 13 auteurs ont accusé Meta d’avoir utilisé leurs œuvres littéraires pour entraîner son GML, appelé « Llama ». Pour ce faire, l’entreprise avait téléchargé des « bibliothèques clandestines » (shadow libraries), c’est-à-dire des banques d’œuvres littéraires (dont certaines avaient été piratées) au nombre desquelles figuraient les œuvres littéraires des demandeurs.
Les demandeurs ont présenté une requête en jugement sommaire pour violation du droit d’auteur, et Meta, une requête incidente en jugement sommaire sur la question de l’utilisation équitable.
En définitive, le juge Chhabria a conclu que : i) l’utilisation des œuvres par Meta afin d’entraîner un GML constituait une utilisation équitable, compte tenu de la nature transformatrice de l’utilisation et de l’absence de répercussions sur le marché des auteurs, ii) le marché potentiel d’octroi de licences concernant les œuvres des auteurs aux fins d’entraînement de l’IA n’était pas pertinent pour l’analyse de l’utilisation équitable et iii) l’innovation en matière d’IA ne serait pas entravée par une décision allant à l’encontre de l’utilisation équitable.
L’utilisation était transformatrice et n’aurait pas de répercussions sur le marché des auteurs
Comme dans Anthropic, deux facteurs clés ont sous-tendu la conclusion du juge Chhabria selon laquelle l’utilisation des œuvres littéraires aux fins d’entraînement de Llama constituait une utilisation équitable : i) l’entraînement des GML constitue une utilisation profondément transformatrice et ii) le logiciel d’IA n’aurait pas de répercussions sur le marché des œuvres littéraires des demandeurs, étant donné qu’il ne peut reproduire qu’un maximum de 50 mots de chacune d’entre elles.
Dans le cadre de sa requête incidente en jugement sommaire, Meta a notamment présenté la preuve que son utilisation des œuvres littéraires des demandeurs aux fins d’entraînement de Llama n’avait eu aucun effet sur leurs ventes3. Les demandeurs n’ont présenté aucune contre-preuve et n’ont fourni aucune réponse significative à cet argument. Le juge Chhabria a noté que le concept de dilution du marché était particulièrement pertinent dans le cadre de l’analyse de l’utilisation équitable, compte tenu de la capacité des GML à inonder le marché d’œuvres concurrentes. Si, au vu des faits qui lui ont été présentés, il a tranché en faveur de Meta, il a admis que l’issue aurait pu être différente si la preuve fournie avait été plus solide [TRADUCTION] :
« Étant donné que la question de la dilution du marché est d’une importance capitale dans ce contexte, si les demandeurs avaient fourni une preuve qu’un jury aurait pu utiliser en leur faveur dans cette affaire, le quatrième facteur aurait dû être soumis à un jury. Ou peut-être que les demandeurs auraient pu présenter des arguments suffisamment solides pour l’emporter sur la question de l’utilisation équitable dans le cadre du jugement sommaire. Mais ils n’ont présenté aucune preuve significative de dilution du marché. En l’absence d’une telle preuve et à la lumière de celle présentée par Meta, le quatrième facteur ne peut qu’être interprété en faveur de cette dernière. Ainsi, en l’espèce, Meta a droit à un jugement sommaire sur la question de l’utilisation équitable qu’elle a présentée en défense contre la réclamation selon laquelle la copie des œuvres littéraires de ces demandeurs pour alimenter son GML constituait une violation du droit d’auteur4. »
Le tribunal a rejeté l’allégation des demandeurs selon laquelle l’utilisation faite par Meta nuirait à leur capacité d’octroyer des licences de leurs œuvres aux fins de l’entraînement de l’IA
Selon le juge Chhabria, le marché potentiel d’octroi de licences concernant les œuvres littéraires des demandeurs aux fins d’entraînement de l’IA n’était pas pertinent, étant donné qu’il s’agissait de l’utilisation même que Meta soutenait être équitable. Autrement dit, en employant cet argument, les demandeurs se sont retrouvés pris dans un cercle vicieux : le droit pour les demandeurs d’octroyer des licences de leurs œuvres littéraires aux fins de l’entraînement de GML dépendait du caractère équitable de cette utilisation. Il s’agit de la même conclusion que celle du juge Alsup dans la cause Anthropic [TRADUCTION] : « un tel marché destiné à cette utilisation ne fait pas partie de ceux que la Copyright Act donne aux auteurs le droit d’exploiter5. »
Comme nous l’avions indiqué dans une précédente actualité (en anglais seulement), le récent rapport du Copyright Office des États-Unis sur le droit d’auteur et l’IA encourage l’octroi volontaire de licences d’œuvres littéraires protégées par le droit d’auteur aux fins d’entraînement de modèles d’IA. Les conclusions du juge Alsup et du juge Chhabria pourraient freiner les incitations visant ce type de licences; toutefois, l’absence de consensus dans la jurisprudence en la matière pourrait soutenir l’obtention de licences, ne serait-ce que pour réduire les risques juridiques et balayer les incertitudes.
Le tribunal ne s’est pas montré convaincu par l’argument selon lequel l’innovation en matière d’IA serait étouffée
Bien que le juge Chhabria ait donné raison à Meta, il a rejeté l’argument de l’entreprise selon lequel l’empêcher d’utiliser des œuvres littéraires protégées par le droit d’auteur aux fins d’entraînement de ses GML entraverait un progrès technologique. Le juge Chhabria a indiqué que ces produits d’IA devraient potentiellement générer [TRADUCTION] « des milliards, voire des billions de dollars » pour les entreprises qui les développent et a estimé que la suggestion selon laquelle l’application du droit d’auteur « arrêterait cette technologie dans son élan était ridicule ». Le juge Chhabria a ensuite précisé qu’un jugement contre l’utilisation équitable ne signifiait pas que les entreprises d’IA devaient cesser tout développement de leurs technologies, mais qu’il leur fallait payer des licences pour utiliser du matériel protégé par le droit d’auteur de façon à s’en servir comme données d’entraînement.
Conclusion
À l’instar de la décision rendue dans Anthropic, celle de la cause Meta établit que l’utilisation d’œuvres protégées par le droit d’auteur aux fins d’entraînement de GML constitue une utilisation équitable, compte tenu de la nature transformatrice des GML et de l’absence de répercussions sur le marché des auteurs. Bien que ces deux décisions aient eu des issues similaires, elles comportent d’importantes différences. Dans la troisième partie de notre série, nous explorerons ces divergences et examinerons les liens potentiels avec le droit canadien sur l’utilisation équitable.