Ancien gouverneur de l’Arkansas et autres auteurs poursuivent Meta, Microsoft et d’autres pour violation du droit d’auteur

Spread the love

L’ancien gouverneur de l’Arkansas, Mike Huckabee, fait partie d’un groupe d’auteurs qui poursuivent Meta, Microsoft et d’autres sociétés pour l’utilisation de leur travail dans la création d’outils d’IA.

Meta et Microsoft accusés de violation du droit d’auteur des auteurs

Dans une plainte déposée mardi, Huckabee et d’autres auteurs, dont l’écrivaine chrétienne Lysa TerKeurst, affirment que leurs livres ont été piratés et utilisés dans des ensembles de données permettant d’entraîner des modèles d’IA. EleutherAI, un groupe de recherche en intelligence artificielle, est également cité dans la poursuite, tout comme Bloomberg.

Le recours collectif proposé est le dernier exemple d’auteurs alléguant que des entreprises technologiques ont utilisé leurs travaux sans autorisation pour former des modèles d’IA génératifs. Au cours des derniers mois, une série d’auteurs populaires, dont George RR Martin, Jodi Picoult et Michael Chabon, ont poursuivi OpenAI pour violation du droit d’auteur.

L’affaire Huckabee se concentre sur un ensemble de données controversé appelé « Books3 » qui contient plus de 180 000 ouvrages faisant partie de l’ensemble de données utilisé pour former de grands modèles de langage. En août, The Atlantic a publié une base de données consultable de tous les titres de Books3 avec des informations sur l’auteur. Books3 fait partie d’une plus grande montagne de données appelée Pile, créée par EleutherAI, qui, selon la poursuite, a été utilisée par les entreprises pour former leurs produits.

La plainte affirme que Meta et Microsoft ont utilisé Books3 pour entraîner leurs modèles d’IA, y compris le modèle de langage LaMDA de Google et le modèle de langage LLM de Microsoft. La plainte allègue que ces modèles d’IA ont été utilisés pour créer des produits et services qui génèrent des textes, des traductions, des codages, des scripts, des pièces musicales, des e-mails, des lettres, etc., qui sont similaires ou identiques aux œuvres des auteurs plaignants.

« [Meta et Microsoft] ont pu incorporer des ensembles de données sophistiqués, qui comprenaient des documents piratés protégés par le droit d’auteur dans Books3, dans le cadre du processus de formation du LLM, sans avoir à rémunérer les auteurs », indique la plainte.

Microsoft a refusé de commenter cette histoire. Meta, Bloomberg et EleutherAI n’ont pas répondu aux demandes de commentaires.

Les entreprises d’IA s’appuient sur d’énormes quantités de données publiques pour former leurs modèles. À mesure que des outils tels que ChatGPT ou Stable Diffusion sont devenus facilement accessibles, il y a eu un débat houleux sur la manière dont les personnes qui fournissent ces données devraient être rémunérées.

En janvier, Getty Images a poursuivi la société à l’origine de l’outil artistique d’IA Stable Diffusion, affirmant qu’elle avait copié illégalement des millions d’images protégées par le droit d’auteur pour entraîner son modèle.

La plainte Huckabee est le dernier exemple de ce débat. Si les auteurs plaignants sont victorieux, cela pourrait avoir un impact important sur la façon dont les entreprises d’IA utilisent les données publiques pour former leurs modèles.

Voici quelques questions que les lecteurs pourraient se poser:

  • Quelles sont les implications de cette plainte pour les auteurs et les entreprises d’IA ?
  • Comment les entreprises d’IA peuvent-elles s’assurer qu’elles utilisent des données publiques de manière éthique ?
  • Comment les auteurs peuvent-ils protéger leurs droits d’auteur sur leurs œuvres ?

Source : The Verge

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *