Icône du site Web Xpert.Digital

3 000 $ par livre : la société d'IA Anthropic verse 1,5 milliard de dollars aux auteurs dans un litige sur les droits d'auteur

3 000 $ par livre : la société d'IA Anthropic verse 1,5 milliard de dollars aux auteurs dans un litige sur les droits d'auteur

3 000 $ par livre : l’entreprise d’intelligence artificielle Anthropic verse 1,5 milliard de dollars aux auteurs suite à un litige sur les droits d’auteur – Image : Xpert.Digital

L'anthropophobie et le règlement à un milliard de dollars : un changement de paradigme dans le droit d'auteur de l'IA

Que signifie l’affaire Anthropic pour l’industrie de l’IA ?

Pourquoi l'entreprise d'IA Anthropic a-t-elle accepté de verser 1,5 milliard de dollars aux auteurs, alors que l'entraînement de modèles d'IA avec des œuvres protégées par le droit d'auteur pourrait être légal ? Cette question préoccupe actuellement l'ensemble du secteur technologique, car cette affaire pourrait marquer un tournant dans le conflit entre développeurs d'IA et titulaires de droits.

Cette affaire est particulièrement remarquable car Anthropic, le fournisseur du chatbot Claude, n'a pas été poursuivi pour l'utilisation de livres protégés par le droit d'auteur pour entraîner son IA, mais pour la manière dont il a obtenu ces données. Le tribunal américain a estimé que si l'entraînement d'une IA avec des textes protégés par le droit d'auteur pouvait, dans certaines circonstances, être couvert par le principe américain du Fair Use, le téléchargement de contenu à partir de sources illégales ne l'était pas. L'essentiel était qu'Anthropic ait démontré la connaissance de l'origine illégale des données.

Convient à:

Comment cet accord historique est-il né ?

Quelles étaient les accusations spécifiques portées contre Anthropic ? Les auteurs accusaient l'entreprise d'avoir téléchargé sans autorisation environ 500 000 livres et textes provenant de deux bases de données en ligne portant atteinte aux droits d'auteur. Ces données ont ensuite été utilisées pour entraîner le chatbot Claude, considéré comme l'un des principaux concurrents de ChatGPT d'OpenAI.

L'accord stipule qu'Anthropic versera environ 3 000 dollars d'indemnisation pour chaque œuvre concernée, soit environ 2 500 euros. Ce montant représente quatre fois le montant minimum légal des dommages et intérêts prévus par la loi américaine sur le droit d'auteur. De plus, Anthropic devra détruire les documents piratés et toutes les copies, mais conservera les droits sur les livres acquis légalement et numérisés.

Pourquoi Anthropic a-t-elle accepté cet accord ? L'entreprise souhaitait éviter un procès qui aurait pu aboutir à des amendes allant jusqu'à 150 000 dollars par livre. Avec 500 000 livres concernés, cela aurait pu entraîner un paiement pouvant atteindre 75 milliards de dollars – une somme potentiellement mortelle, même pour une entreprise qui a récemment levé 13 milliards de dollars.

Quelle est la différence entre la situation juridique aux États-Unis et en Allemagne ?

Comment un cas similaire serait-il évalué en Allemagne ? Contrairement au droit américain, le droit d'auteur allemand ne dispose pas d'une doctrine d'usage équitable permettant une évaluation flexible au cas par cas. Au lieu de cela, des limitations spécifiques sont clairement définies pour des finalités spécifiques qui restreignent les droits des auteurs.

Avec la mise en œuvre de la directive européenne sur le droit d'auteur, l'Allemagne a créé l'article 44b de la loi sur le droit d'auteur (UrhG), qui réglemente la fouille de textes et de données (TDM). Cette disposition permet l'analyse automatisée de grandes quantités de données, qu'il s'agisse de textes ou d'images, afin d'en extraire des informations. L'entraînement d'une IA relève généralement de cette réglementation.

Mais quelles restrictions s'appliquent aux fournisseurs commerciaux ? L'autorisation TDM comporte une clause essentielle : les titulaires de droits peuvent s'opposer à l'utilisation de leurs œuvres à des fins commerciales TDM. Cette réserve d'utilisation doit être formulée sous une forme lisible par machine, par exemple dans les métadonnées ou les conditions d'utilisation d'un site web.

La directive européenne DSM distingue deux types de fouille de textes et de données : l'article 3 autorise la fouille de textes et de données à des fins de recherche scientifique par les institutions de recherche et les institutions du patrimoine culturel, à condition qu'elles aient un accès légal aux œuvres. Cette exception est obligatoire et ne peut être exclue par des clauses contractuelles. L'article 4, quant à lui, autorise la fouille de textes et de données à toutes fins, y compris commerciales, mais avec l'importante restriction de la procédure de refus.

Quels aspects techniques jouent un rôle dans l’évaluation juridique ?

Pourquoi le fonctionnement technique de l'entraînement de l'IA est-il si important pour l'évaluation juridique ? Une étude récente de la Copyright Initiative, menée par les professeurs Tim W. Dornis et Sebastian Stober, met en lumière la boîte noire de l'entraînement de l'IA. Les chercheurs concluent que, techniquement parlant, l'entraînement de modèles d'IA génératifs ne relève pas de l'exploration de textes et de données classique, mais constitue plutôt une forme de violation du droit d'auteur.

Comment se déroule techniquement l'entraînement des modèles d'IA ? Ce processus comporte plusieurs étapes soumises au droit d'auteur : tout d'abord, les données sont collectées systématiquement, ce qui constitue déjà une duplication au regard du droit d'auteur. Ensuite, les données collectées sont stockées sur des serveurs et préparées pour l'entraînement. Enfin, le modèle d'IA analyse les données et en extrait des modèles, des styles et des informations.

Un point particulièrement critique est la mémorisation : les données d'apprentissage sont mémorisées en tout ou partie par les modèles génératifs actuels et peuvent donc être régénérées et reproduites à la demande des utilisateurs finaux. Cela va bien au-delà de l'analyse pure, qui est au cœur de l'exploration traditionnelle de textes et de données.

Comment Claude se positionne face à la concurrence de ChatGPT ?

Quel est l'impact du litige sur les droits d'auteur sur la position d'Anthropic sur le marché ? Malgré les problèmes juridiques, Claude s'est imposé comme un concurrent sérieux de ChatGPT. Selon les analyses de marché actuelles, Anthropic détient désormais 32 % des parts de marché des grands modèles linguistiques en entreprise, tandis qu'OpenAI se classe deuxième avec 25 %.

Anthropic est particulièrement bien positionné dans le domaine de la programmation : avec 42 % de parts de marché, l'entreprise est de loin le plus grand fournisseur, soit plus du double des 21 % d'OpenAI. Claude doit cette domination principalement à son impressionnante fenêtre contextuelle de 200 000 jetons, qui permet de traiter des rapports d'entreprise complets en une seule passe.

Quels sont les atouts spécifiques de Claude par rapport à ChatGPT ? Claude est souvent salué pour sa communication plus « humaine » et sa compréhension nuancée de concepts complexes. Son orientation vers le développement éthique et la sécurité de l'IA a fait d'Anthropic un fournisseur de confiance pour les entreprises qui accordent une importance particulière au comportement responsable dans les applications sensibles.

Anthropic s'appuie sur l'IA constitutionnelle, un processus qui intègre des principes éthiques directement dans ses modèles. Cela permet d'éviter les résultats préjudiciables ou biaisés et d'instaurer un niveau de confiance élevé avec les utilisateurs. Si OpenAI travaille également sur la sécurité de l'IA, l'engagement explicite d'Anthropic à développer des modèles d'IA respectueux de l'éthique lui confère un avantage considérable.

Quels autres procès affectent l’industrie de l’IA ?

L'affaire Anthropic n'est-elle que la partie émergée de l'iceberg ? En réalité, plus de 40 procès sont en cours contre des fournisseurs de technologies d'IA aux États-Unis pour violation de droits d'auteur. OpenAI, par exemple, a été poursuivi par le New York Times, et d'autres poursuites sont en cours contre Anthropic suite à cet accord, notamment de la part d'éditeurs de musique et de la plateforme en ligne Reddit.

Apple est également devenue récemment la cible de poursuites judiciaires pour atteinte aux droits d'auteur : des auteurs ont poursuivi l'entreprise technologique pour avoir prétendument utilisé illégalement leurs livres protégés par le droit d'auteur pour entraîner ses systèmes d'IA. Les plaignants accusent Apple d'avoir copié les œuvres protégées par le droit d'auteur sans consentement, attribution ni compensation.

En Allemagne, la GEMA est la première société de gestion collective au monde à intenter une action en justice contre OpenAI pour utilisation sans licence d'œuvres musicales protégées. La GEMA accuse OpenAI d'avoir reproduit des paroles de chansons protégées d'auteurs allemands sans acquérir de licences ni rémunérer les auteurs.

Comment évolue la question de l’opt-out ?

Que signifie concrètement la procédure de retrait pour les titulaires de droits ? En vertu du droit allemand, les auteurs et les titulaires de droits peuvent déclarer une restriction d'utilisation lisible par machine afin d'exclure leurs œuvres de l'utilisation TDM. Par exemple, Sony Music Group a publié une « Déclaration de retrait de la formation à l'IA » afin de protéger son contenu contre toute utilisation non autorisée de l'IA.

Cependant, la mise en œuvre pratique du mécanisme d'opt-out est complexe : la manière dont une telle réserve doit être déclarée techniquement et juridiquement efficace, et la manière dont les développeurs d'IA doivent la gérer, n'ont pas encore été clarifiées de manière concluante. Certains craignent qu'une large utilisation de l'opt-out puisse restreindre considérablement les données d'entraînement des modèles d'IA en Europe.

Les entreprises d'IA doivent respecter ces restrictions d'utilisation et ne peuvent les contourner. Pour qu'une œuvre soit intégrée au corpus de données d'entraînement malgré ces restrictions, le développeur doit entamer des négociations de licence avec le titulaire des droits. Cela créera un nouveau marché de licences, qui n'est toutefois pas encore établi.

 

Une nouvelle dimension de la transformation numérique avec l'intelligence artificielle (IA) - Plateforme et solution B2B | Xpert Consulting

Une nouvelle dimension de la transformation numérique avec l'intelligence artificielle (IA) – Plateforme et solution B2B | Xpert Consulting - Image : Xpert.Digital

Ici, vous apprendrez comment votre entreprise peut mettre en œuvre des solutions d’IA personnalisées rapidement, en toute sécurité et sans barrières d’entrée élevées.

Une plateforme d'IA gérée est une solution complète et sans souci pour l'intelligence artificielle. Au lieu de gérer une technologie complexe, une infrastructure coûteuse et des processus de développement longs, vous recevez une solution clé en main adaptée à vos besoins, proposée par un partenaire spécialisé, souvent en quelques jours.

Les principaux avantages en un coup d’œil :

⚡ Mise en œuvre rapide : De l'idée à la mise en œuvre opérationnelle en quelques jours, et non en quelques mois. Nous proposons des solutions concrètes qui créent une valeur immédiate.

🔒 Sécurité maximale des données : Vos données sensibles restent chez vous. Nous garantissons un traitement sécurisé et conforme, sans partage de données avec des tiers.

💸 Aucun risque financier : vous ne payez qu'en fonction des résultats. Les investissements initiaux importants en matériel, logiciels ou personnel sont totalement éliminés.

🎯 Concentrez-vous sur votre cœur de métier : concentrez-vous sur ce que vous faites le mieux. Nous prenons en charge l'intégralité de la mise en œuvre technique, de l'exploitation et de la maintenance de votre solution d'IA.

📈 Évolutif et évolutif : Votre IA évolue avec vous. Nous garantissons une optimisation et une évolutivité continues, et adaptons les modèles avec souplesse aux nouvelles exigences.

En savoir plus ici :

 

Marché des licences pour les données IA : opportunité pour les éditeurs ou risque pour les startups ?

Quel rôle joue le règlement de l’UE sur l’IA ?

Quel est l'impact du nouveau règlement européen sur l'IA sur le droit d'auteur ? Bien que le règlement sur l'IA ne contienne aucune nouvelle disposition concernant les exceptions au droit d'auteur, il précise que l'utilisation de contenus protégés par le droit d'auteur nécessite l'autorisation du titulaire des droits, sauf en cas de limitation.

Tous les fournisseurs de modèles d'IA à usage général doivent se conformer à des exigences de documentation exhaustives. Celles-ci incluent une description détaillée des données utilisées pour l'entraînement, incluant leur type et leur origine, ainsi que les méthodes de traitement. Ils doivent notamment garantir l'identification et le respect des réserves légales prévues par la directive DSM.

L'Office for Artificial Intelligence contrôle le respect de ces dispositions, mais n'examine pas les violations du droit d'auteur œuvre par œuvre. En se référant à la directive DSM, le règlement IA précise que le législateur suppose que l'exception relative à l'exploration de textes et de données s'applique à l'entraînement des modèles d'IA génératifs.

Convient à:

Quelle est la différence entre l’utilisation scientifique et l’utilisation commerciale ?

Quelles réglementations particulières s'appliquent à la recherche scientifique ? Dans une décision historique, le tribunal régional de Hambourg a statué que les organismes de recherche peuvent, sous certaines conditions, utiliser des œuvres protégées par le droit d'auteur pour la formation de l'intelligence artificielle. L'affaire concernait l'utilisation d'une image protégée par le droit d'auteur par un organisme de recherche ayant créé un ensemble complet de données image-texte pour la formation de modèles d'IA génératifs.

La Cour a statué que la création d'un ensemble de données d'entraînement à l'IA pouvait relever de la liberté de recherche, même si des entreprises commerciales utilisaient ultérieurement les données ainsi obtenues. L'essentiel est que la création initiale de l'ensemble de données serve à l'acquisition de connaissances. Le terme « recherche scientifique » est interprété au sens large dans ce contexte.

L'article 60d de la loi allemande sur le droit d'auteur (UrhG) autorise l'exploration de textes et de données scientifiques par des instituts de recherche tels que les universités à des fins de recherche scientifique non commerciale. Le consentement des titulaires de droits n'est pas requis. Ceci contraste avec l'utilisation commerciale, pour laquelle la procédure d'exclusion s'applique.

Quelles différences internationales existent ?

Comment les autres pays abordent-ils la question du droit d'auteur sur l'IA ? Le Japon est considéré comme particulièrement favorable à l'innovation et a déjà modifié sa loi sur le droit d'auteur en 2018. L'article 30-4 de la loi japonaise sur le droit d'auteur introduit une exception flexible pour les utilisations autres que celles destinées à la jouissance de l'œuvre. Cette exception est souvent interprétée comme incluant l'entraînement des modèles d'IA, à condition que l'objectif soit l'analyse des données et non la consommation de l'œuvre elle-même.

Le Royaume-Uni a suivi sa propre voie après le Brexit. Des consultations ont été menées sur les exceptions au droit d'auteur pour les développeurs d'IA, notamment pour le TDM. Cependant, ces propositions ont suscité de vives inquiétudes au sein des industries créatives, de sorte que l'avenir reste incertain.

La Chine a modifié sa loi sur le droit d'auteur en 2020, renforçant ainsi la protection de la propriété intellectuelle. Une réglementation spécifique à la formation à l'IA est encore en cours d'élaboration, mais le pays reconnaît l'importance stratégique de l'IA et devrait rechercher des solutions pragmatiques.

Que signifie cette affaire pour les autres entreprises d’IA ?

Quels enseignements les autres entreprises d'IA peuvent-elles tirer de l'affaire Anthropic ? La comparaison montre que la provenance des données d'entraînement est cruciale. Si l'entraînement avec des données acquises légalement peut être couvert par les barrières du fair use ou du TDM, l'utilisation de données obtenues illégalement peut entraîner de lourdes amendes.

Les entreprises d'IA concluent de plus en plus d'accords de licence avec les détenteurs de droits d'auteur pour accéder à leurs contenus. OpenAI, par exemple, a signé des accords avec diverses sociétés de médias, et d'autres fournisseurs suivent son exemple. L'accord avec Anthropic pourrait accélérer cette évolution et donner naissance à un marché des licences bien établi.

Il est crucial pour les fournisseurs de modèles et de systèmes d'IA de faire appel à des prestataires de confiance pour générer des données d'entraînement, qui respectent les droits de propriété intellectuelle des tiers lors de la création des données. Même en l'absence de connaissance d'une violation du droit d'auteur, des conséquences juridiques peuvent survenir.

Comment le marché des données de formation de l’IA va-t-il évoluer ?

Un nouveau marché de licences pour les données d'entraînement à l'IA est-il en train d'émerger ? L'affaire Anthropic et d'autres procès similaires suggèrent l'émergence d'un marché structuré de licences de contenu pour l'entraînement à l'IA. Les éditeurs, auteurs et autres détenteurs de droits reconnaissent de plus en plus la valeur de leur contenu pour le développement de l'IA.

Parallèlement, les entreprises d'IA sont confrontées au défi d'acquérir des données d'entraînement de haute qualité et juridiquement fiables. Le coût de ces licences peut être important, notamment pour les petites entreprises qui ne disposent pas des ressources d'Anthropic ou d'OpenAI.

L'émergence de fournisseurs de données spécialisés, capables de créer et de licencier des ensembles de données d'entraînement conformes à la législation, est une conséquence logique de cette évolution. Ces fournisseurs pourraient servir d'intermédiaires entre les titulaires de droits et les développeurs d'IA, garantissant ainsi le respect de toutes les exigences légales.

Quel impact cela a-t-il sur l’innovation et la concurrence ?

Le durcissement du cadre juridique freine-t-il l'innovation dans le développement de l'IA ? Cette question est controversée. Les partisans d'un droit d'auteur strict soutiennent que les créateurs et les titulaires de droits devraient être rémunérés équitablement pour l'utilisation de leurs œuvres. Cependant, la grande quantité de données d'apprentissage requises et les coûts de licence associés pourraient entraîner une concentration du marché entre quelques grands fournisseurs.

Les petites entreprises et les startups ne pourraient pas se permettre les licences nécessaires, ce qui limiterait leur capacité à développer des modèles d'IA compétitifs. Paradoxalement, cela pourrait entraîner une baisse de l'innovation et de la concurrence, car seules des entreprises bien financées comme Anthropic, OpenAI ou Google peuvent fournir les ressources nécessaires.

D'autre part, la nécessité de payer des droits de licence pourrait conduire à des méthodes de formation plus efficaces. Les développeurs d'IA pourraient investir davantage dans des techniques nécessitant moins de données ou utiliser des données synthétiques pour réduire leur dépendance aux contenus sous licence.

Comment se positionnent les ayants droit et les créatifs ?

Quelles stratégies les auteurs, les éditeurs et les autres détenteurs de droits adoptent-ils ? La Copyright Initiative et des organisations similaires appellent à une meilleure prise en compte du droit d'auteur dans la formation en IA. Elles affirment que l'utilisation d'œuvres protégées par le droit d'auteur par les entreprises d'IA sans consentement ni rémunération constitue un « vol de propriété intellectuelle à grande échelle ».

De nombreux titulaires de droits recourent de plus en plus à des mécanismes de retrait pour protéger leurs œuvres contre toute utilisation non désirée de l'IA. Parallèlement, ils explorent des moyens de tirer profit du développement de l'IA par le biais d'accords de licence. Cette situation engendre un mélange complexe de litiges juridiques et d'opportunités commerciales.

Le procès intenté par la GEMA contre OpenAI démontre que les sociétés de gestion collective jouent également un rôle actif dans ce litige. En tant que collectifs, elles pourraient fédérer les intérêts de leurs membres et mener des négociations de licences avec les entreprises d'IA.

Quelles sont les perspectives à long terme ?

Comment la situation juridique pourrait-elle évoluer dans les années à venir ? L'affaire Anthropic pourrait n'être que le début d'une vague d'accords et de décisions judiciaires redéfinissant les règles de formation de l'IA. Aux États-Unis, d'autres affaires pourraient clarifier la doctrine de l'usage équitable en matière d'IA, tandis qu'en Europe, l'application pratique des limitations du TDM est en cours d'affinement.

Le règlement européen sur l'IA devrait apporter des précisions supplémentaires concernant les exigences de documentation et le respect du droit d'auteur. Cela pourrait conduire à une harmonisation des pratiques au sein de l'UE, mais aussi à des différences avec d'autres juridictions.

Le développement technologique sera un facteur important : si les modèles d'IA peuvent être entraînés efficacement avec moins de données ou avec des données synthétiques à l'avenir, cela pourrait atténuer le problème du droit d'auteur. Parallèlement, de nouvelles techniques de détection et de compensation de l'utilisation de contenus protégés par le droit d'auteur pourraient être développées.

L'affaire Anthropic marque un tournant important dans le développement du secteur de l'IA. Elle démontre que le cadre juridique de la formation des modèles d'IA n'est pas encore totalement clarifié et que les entreprises d'IA et les détenteurs de droits doivent trouver de nouvelles façons d'aligner leurs intérêts. Ce règlement de 1,5 milliard de dollars pourrait marquer le début d'une nouvelle ère où l'utilisation de contenus protégés par le droit d'auteur pour la formation de l'IA se fera de manière plus équitable et plus transparente.

 

Sécurité des données UE/DE | Intégration d'une plateforme d'IA indépendante et multi-sources de données pour tous les besoins des entreprises

Les plateformes d'IA indépendantes, une alternative stratégique pour les entreprises européennes - Image : Xpert.Digital

KI-GAMECHANGER: Les solutions de fabrication de plate-forme d'IA les plus flexibles qui réduisent les coûts, améliorent leurs décisions et augmentent l'efficacité

Plateforme d'IA indépendante: intègre toutes les sources de données de l'entreprise pertinentes

  • Intégration rapide de l'IA: solutions d'IA sur mesure pour les entreprises en heures ou jours au lieu de mois
  • Infrastructure flexible: cloud ou hébergement dans votre propre centre de données (Allemagne, Europe, libre choix de l'emplacement)
  • La sécurité des données la plus élevée: l'utilisation dans les cabinets d'avocats est la preuve sûre
  • Utiliser sur une grande variété de sources de données de l'entreprise
  • Choix de vos propres modèles d'IA (DE, DE, UE, USA, CN)

En savoir plus ici :

 

Nous sommes là pour vous - conseil - planification - mise en œuvre - gestion de projet

☑️ Accompagnement des PME en stratégie, conseil, planification et mise en œuvre

Création ou réalignement de la stratégie de l'IA

☑️ Développement commercial pionnier

 

Konrad Wolfenstein

Je serais heureux de vous servir de conseiller personnel.

Vous pouvez me contacter en remplissant le formulaire de contact ci-dessous ou simplement m'appeler au +49 89 89 674 804 (Munich) .

J'attends avec impatience notre projet commun.

 

 

Écris moi

 
Xpert.Digital - Konrad Wolfenstein

Xpert.Digital est une plateforme industrielle axée sur la numérisation, la construction mécanique, la logistique/intralogistique et le photovoltaïque.

Avec notre solution de développement commercial à 360°, nous accompagnons des entreprises de renom depuis les nouvelles affaires jusqu'à l'après-vente.

L'intelligence de marché, le smarketing, l'automatisation du marketing, le développement de contenu, les relations publiques, les campagnes de courrier électronique, les médias sociaux personnalisés et le lead nurturing font partie de nos outils numériques.

Vous pouvez en savoir plus sur : www.xpert.digital - www.xpert.solar - www.xpert.plus

Rester en contact

Quitter la version mobile