Selon un juge, l'entraînement de modèles d'IA avec des livres est autorisé par la doctrine de «l'usage raisonnable» de la législation américaine sur les droits d'auteur.
Un juge américain a statué lundi que l'utilisation de livres pour former des logiciels d'intelligence artificielle (IA) sans la permission de leurs auteurs ne constituait pas une violation de la loi américaine en vertu «d'un usage raisonnable».
Cette décision, susceptible de faire date dans l’histoire de l’intelligence artificielle, fait suite à un procès intenté l'année dernière contre la société d'IA Anthropic par trois écrivains, qui ont accusé la société d'avoir volé leur travail pour former son modèle d'IA, Claude, et bâtir une entreprise de plusieurs milliards de dollars.
Dans sa décision, le juge William Alsup a écrit que l'utilisation des livres des auteurs par Anthropic était «extrêmement transformatrice» et donc autorisée par la loi américaine. «L'utilisation des livres en question dans le but d'entraîner Claude a engendré des évolutions spectaculaires et relevait de l'usage raisonnable», a-t-il écrit dans sa décision.
Il a qualifié l’intelligence artificielle de «technologie parmi les plus révolutionnaires que beaucoup d'entre nous verront dans leur vie» et a comparé l'apprentissage d'une IA à celui que les êtres humains effectuent en lisant des livres.
Piratage interdit
Si le juge ne s’est pas opposé au fait que des sociétés nourrissent leurs modèles d’IA en utilisant des livres existants, et ce même sans l’accord de leurs auteurs, en revanche, il a déclaré qu’elles ne devraient pas pirater les livres sur lesquels elles s’entraînent. Il a ainsi rejeté la demande d'Anthropic de classer l'affaire, estimant que l'entreprise devrait être jugée pour son utilisation de copies «piratées» pour constituer sa bibliothèque de documents.
Anthropic, une entreprise soutenue par Amazon et la société mère de Google, Alphabet, pourrait dans cette affaire être redevable de dommages et intérêts pouvant atteindre 150.000 dollars (soit 216.000 euros) par œuvre protégée par le droit d'auteur, rapporte la BBC. L'entreprise détiendrait plus de sept millions de livres piratés dans une «bibliothèque centrale», selon le juge.
Cette décision est l'une des premières à se prononcer sur une question qui fait l'objet de nombreuses batailles juridiques et éthiques à savoir comment modèles d'intelligence artificielle peuvent légitimement apprendre à partir de matériel existant.