3 000 dollar per bok: AI-företaget Anthropic betalar 1,5 miljarder dollar till författare i upphovsrättstvist

Konrad Wolfenstein

för 9 månader sedan

3 000 dollar per bok: AI-företaget Anthropic betalar 1,5 miljarder dollar till författare i upphovsrättstvist – Bild: Xpert.Digital

Antropisk och miljarduppgörelsen: Ett paradigmskifte inom AI-upphovsrättslagen

Vad betyder det antropiska fallet för AI-industrin?

Varför gick AI-företaget Anthropic med på en uppgörelse på 1,5 miljarder dollar med upphovsmän, trots att det kan vara lagligt att träna AI-modeller med upphovsrättsskyddade verk? Denna fråga upptar just nu hela teknikbranschen, eftersom fallet kan markera en vändpunkt i konflikten mellan AI-utvecklare och upphovsrättsinnehavare.

Fallet är särskilt anmärkningsvärt eftersom Anthropic, leverantören av Claude-chattroboten, inte stämdes för att ha använt upphovsrättsskyddade böcker för att träna sin AI, utan snarare för hur dessa data erhölls. Den amerikanska domstolen fastställde att även om träning av en AI med upphovsrättsskyddade texter under vissa omständigheter kunde omfattas av den amerikanska doktrinen om rättvis användning, så var det inte fallet att ladda ner innehållet från olagliga källor. Avgörande är att Anthropic bevisligen var medveten om informationens olagliga ursprung.

Relaterat till detta:

Anthropic och AI-soldaten Claude: Uppgången till AI-jätten – utvärdering, konkurrens och etiska visioner

Hur kom denna historiska överenskommelse till?

Vilka var de specifika anklagelserna mot Anthropic? Författarna anklagade företaget för att ha laddat ner cirka 500 000 böcker och texter utan tillstånd från två upphovsrättsintrångande onlinedatabaser. Denna data användes sedan för att träna AI-chattroboten Claude, som anses vara en av huvudkonkurrenterna till OpenAI:s ChatGPT.

Förlikningen föreskriver att Anthropic ska betala cirka 3 000 dollar i ersättning för varje berört verk – ungefär motsvarande 2 500 euro. Denna summa är fyra gånger det lägsta lagstadgade skadeståndet enligt amerikansk upphovsrättslag. Dessutom måste Anthropic förstöra de piratkopierade dokumenten och alla kopior, men behåller rättigheterna till lagligt förvärvade och skannade böcker.

Varför gick Anthropic med på denna förlikning? Företaget ville undvika en rättegång som kunde ha resulterat i böter på upp till 150 000 dollar per bok. Med 500 000 berörda verk skulle detta ha lett till en potentiell utbetalning på upp till 75 miljarder dollar – en förlamande summa även för ett företag som nyligen hade samlat in 13 miljarder dollar.

Vilka är skillnaderna mellan den rättsliga situationen i USA och i Tyskland?

Hur skulle ett liknande fall bedömas i Tyskland? Till skillnad från amerikansk lag erkänner inte tysk upphovsrättslag en doktrin om rättvis användning som möjliggör flexibel bedömning från fall till fall. Istället är specifika begränsningar och undantag tydligt definierade för särskilda ändamål, vilket begränsar upphovsrättsinnehavarnas rättigheter.

I och med implementeringen av EU:s upphovsrättsdirektiv skapade Tyskland paragraf 44b i upphovsrättslagen, som reglerar så kallad text- och datautvinning (TDM). Denna bestämmelse tillåter automatiserad analys av stora datamängder – oavsett om det är text eller bilder – för att utvinna information. Utbildning av AI faller generellt sett under denna förordning.

Vilka begränsningar gäller för kommersiella leverantörer? TDM-licensen har en avgörande nackdel: upphovsrättsinnehavare kan invända mot användningen av deras verk för kommersiell TDM. Denna så kallade användningsreservation måste vara i maskinläsbar form, till exempel i metadata eller användarvillkoren för en webbplats.

EU:s DSM-direktiv skiljer mellan två typer av text- och datautvinning: Artikel 3 tillåter TDM för vetenskapliga forskningsändamål av forskningsinstitutioner och kulturarvsinstitutioner, förutsatt att de har laglig tillgång till verken. Detta undantag är obligatoriskt och kan inte uteslutas genom avtalsklausuler. Artikel 4, å andra sidan, tillåter generell TDM för alla ändamål, inklusive kommersiella, men med den viktiga begränsningen av ett opt-out-förfarande.

Vilka tekniska aspekter spelar roll i den juridiska bedömningen?

Varför är det tekniska arbetet med AI-utbildning så viktigt för juridisk bedömning? En nyligen genomförd studie av Copyright Initiative, utförd av professor Tim W. Dornis och professor Sebastian Stober, belyser den svarta lådan inom AI-utbildning. Forskarna drar slutsatsen att utbildning av generativa AI-modeller, tekniskt sett, inte är klassisk text- och datautvinning, utan snarare en form av upphovsrättsintrång.

Vad händer tekniskt sett när man tränar AI-modeller? Processen involverar flera steg som är relevanta för upphovsrätt: Först samlas data systematiskt in, vilket redan utgör reproduktion enligt upphovsrättslagen. Därefter lagras den insamlade datan på servrar och förbereds för träning. Slutligen analyserar AI-modellen data och extraherar mönster, stilar och information.

En särskilt kritisk punkt är så kallad memorering: Träningsdata memoreras delvis eller helt av nuvarande generativa modeller och kan därför regenereras och därmed replikeras av slutanvändare med lämpliga uppmaningar. Detta går långt utöver ren analys, vilket är fokus för klassisk text- och datautvinning.

Hur positionerar sig Claude i konkurrensen med ChatGPT?

Vilken inverkan har upphovsrättstvisten på Anthropics marknadsposition? Trots de juridiska problemen har Claude etablerat sig som en seriös konkurrent till ChatGPT. Enligt aktuella marknadsanalyser har Anthropic nu 32 procent av marknadsandelen för stora språkmodeller i företag, medan OpenAI ligger på andra plats med 25 procent.

Anthropics position är särskilt stark inom programmeringsområdet: med en marknadsandel på 42 procent är företaget den klart största leverantören, mer än dubbelt så stark som OpenAI med 21 procent. Claude har främst föranlett denna dominans sitt imponerande kontextfönster på 200 000 tokens, vilket möjliggör bearbetning av kompletta affärsrapporter i ett enda svep.

Vilka är Claudes specifika styrkor jämfört med ChatGPT? Claude hyllas ofta för sin mer "mänskliga" kommunikationsstil och nyanserade förståelse av komplexa koncept. Anthropics fokus på etisk AI-utveckling och säkerhet har etablerat dem som en betrodd leverantör för företag som lägger särskild vikt vid ansvarsfulla metoder i känsliga applikationer.

Anthropic förlitar sig på konstitutionell AI, en metod som integrerar etiska riktlinjer direkt i modellerna. Detta hjälper till att förhindra skadliga eller partiska utgifter och bygger upp en hög nivå av användarförtroende. Även om OpenAI också är aktivt inom AI-säkerhet, ger Anthropics uttryckliga engagemang för att utveckla etiskt sunda AI-modeller dem en betydande fördel.

Vilka andra stämningar påverkar AI-branschen?

Är Anthropic-fallet bara toppen av isberget? Faktum är att över 40 stämningar pågår i USA mot leverantörer av AI-teknik för upphovsrättsintrång. OpenAI, till exempel, stämdes av New York Times, och ytterligare stämningar pågår mot Anthropic efter denna förlikning, inklusive de från musikförlag och onlineplattformen Reddit.

Apple har också nyligen blivit måltavla för upphovsrättsstämningar: Författare har stämt teknikföretaget och hävdat att det olagligt använt deras upphovsrättsskyddade böcker för att träna sina AI-system. Kärandena anklagar Apple för att ha kopierat de skyddade verken utan tillstånd, tillskrivning eller ersättning.

I Tyskland blev GEMA den första upphovsrättsorganisationen i världen att stämma OpenAI för olicensierad användning av upphovsrättsskyddade musikaliska verk. GEMA anklagar OpenAI för att reproducera upphovsrättsskyddade sångtexter av tyska upphovsmän utan att ha förvärvat licenser eller kompenserat upphovsmännen.

Hur utvecklas frågan om att välja bort?

Vad innebär opt-out-förfarandet i praktiken för rättighetsinnehavare? Enligt tysk lag kan upphovsmän och rättighetsinnehavare deklarera ett maskinläsbart användningsreservation för att undanta sina verk från TDM-användning. Sony Music Group har till exempel publicerat en "Declaration of AI Training Opt Out" (Förklaring om opt-out för AI-utbildning) för att skydda sitt innehåll från obehörig AI-användning.

Det praktiska genomförandet av opt-out-mekanismen är dock komplext: Hur exakt ett sådant reservation måste deklareras på ett tekniskt och juridiskt effektivt sätt, och hur AI-utvecklare ska hantera det, har ännu inte slutgiltigt klargjorts. Det finns en oro för att ett allmänt använt opt-out-system avsevärt skulle kunna begränsa träningsdata för AI-modeller i Europa.

AI-företag måste respektera dessa användningsrestriktioner och får inte kringgå dem. Om ett verk ska inkluderas i träningsdatakorpusen trots dessa restriktioner måste utvecklaren inleda licensförhandlingar med rättighetsinnehavaren. Detta leder till en ny licensmarknad, som dock ännu inte är etablerad.

En ny dimension av digital transformation med 'Managed AI' (Artificial Intelligence) - Plattform & B2B-lösning | Xpert Consulting

En ny dimension av digital transformation med 'Managed AI' (Artificial Intelligence) – Plattform & B2B-lösning | Xpert Consulting - Bild: Xpert.Digital

Här får du lära dig hur ditt företag kan implementera skräddarsydda AI-lösningar snabbt, säkert och utan höga inträdesbarriärer.

En hanterad AI-plattform är din heltäckande och bekymmersfria lösning för artificiell intelligens. Istället för att behöva hantera komplex teknik, dyr infrastruktur och långa utvecklingsprocesser får du en färdig lösning skräddarsydd efter dina behov från en specialiserad partner – ofta inom bara några dagar.

De viktigaste fördelarna i korthet:

⚡ Snabb implementering: Från idé till färdig applikation på dagar, inte månader. Vi levererar praktiska lösningar som skapar omedelbart mervärde.

🔒 Maximal datasäkerhet: Dina känsliga uppgifter stannar hos dig. Vi garanterar säker och korrekt behandling utan att dela data med tredje part.

💸 Ingen ekonomisk risk: Du betalar bara för resultat. Höga initiala investeringar i hårdvara, mjukvara eller personal elimineras helt.

🎯 Fokusera på din kärnverksamhet: Koncentrera dig på det du gör bäst. Vi tar hand om hela den tekniska implementeringen, driften och underhållet av din AI-lösning.

📈 Framtidssäkert och skalbart: Din AI växer med dig. Vi säkerställer kontinuerlig optimering och skalbarhet, och anpassar modellerna flexibelt till nya krav.

Mer information här:

Den hanterade AI-lösningen - Industriella AI-tjänster: Nyckeln till konkurrenskraft inom tjänste-, industri- och maskintekniksektorerna

Licensmarknaden för AI-data: Möjlighet för utgivare eller risk för startups?

Vilken roll spelar EU:s AI-förordning?

Hur påverkar EU:s nya AI-förordning upphovsrätten? Även om AI-förordningen inte innehåller några nya bestämmelser om undantag från upphovsrätten, förtydligar den att användning av upphovsrättsskyddat innehåll kräver rättighetsinnehavarens tillstånd, såvida inte en begränsning gäller.

Alla leverantörer av generella AI-modeller måste uppfylla omfattande dokumentationskrav. Detta inkluderar en detaljerad beskrivning av de data som används för utbildning, inklusive datatyp och ursprung samt bearbetningsmetoder. De måste särskilt säkerställa identifiering och efterlevnad av rättsliga reservationer enligt DSM-direktivet.

Kontoret för artificiell intelligens övervakar efterlevnaden av dessa bestämmelser, men granskar inte upphovsrättsintrång verk för verk. Genom att hänvisa till DSM-direktivet förtydligar AI-förordningen att lagstiftaren antar att undantaget för text- och datautvinning är tillämpligt på träning av generativa AI-modeller.

Relaterat till detta:

Antropiske Claude Gov: Spännande AI-utveckling för USA:s nationella säkerhet

Hur skiljer sig vetenskaplig och kommersiell användning?

Vilka särskilda regler gäller för vetenskaplig forskning? I ett banbrytande beslut beslutade Hamburgs regionala domstol att forskningsorganisationer, under vissa förutsättningar, får använda upphovsrättsskyddade verk för att träna artificiell intelligens. Fallet gällde användningen av en upphovsrättsskyddad bild av en forskningsorganisation som hade skapat en stor bild-text-datauppsättning för att träna generativa AI-modeller.

Domstolen beslutade att skapandet av en AI-utbildningsdatauppsättning kan falla under forskningsfriheten, även om kommersiella företag senare använder den data som erhållits på detta sätt. Den avgörande faktorn är att det initiala skapandet av datauppsättningen tjänar syftet att inhämta kunskap. Begreppet vetenskaplig forskning tolkas brett i detta sammanhang.

Paragraf 60d i den tyska upphovsrättslagen (UrhG) tillåter vetenskaplig text- och datautvinning av forskningsinstitutioner som universitet för icke-kommersiell vetenskaplig forskning. Samtycke från upphovsrättsinnehavarna krävs inte för detta. Detta står i kontrast till kommersiell användning, där ett avanmälningsförfarande gäller.

Vilka internationella skillnader finns det?

Hur hanterar andra länder frågan om upphovsrätt gällande AI? Japan anses vara särskilt innovationsvänligt och ändrade redan sin upphovsrättslag 2018. Artikel 30-4 i den japanska upphovsrättslagen inför ett flexibelt undantag för användning som inte tjänar "njutningen" av verket. Detta tolkas ofta som att det även kan omfatta träning av AI-modeller, så länge målet är dataanalys och inte konsumtion av själva verket.

Storbritannien har gått sin egen väg sedan Brexit. Samråd har hållits angående upphovsrättsundantag för AI-utvecklare, särskilt för TDM. Förslagen mötte dock betydande farhågor från de kreativa näringarna, vilket gjorde den framtida inriktningen oklar.

Kina ändrade sin upphovsrättslag 2020 och stärker generellt skyddet av immateriella rättigheter. Specifika regler för AI-utbildning är fortfarande under utveckling, men landet inser AI:s strategiska betydelse och förväntas söka pragmatiska lösningar.

Vad betyder det här fallet för andra AI-företag?

Vilka lärdomar kan andra AI-företag dra av Anthropic-fallet? Jämförelsen visar att ursprunget till träningsdata är avgörande. Medan träning med lagligt förvärvad data kan omfattas av begränsningar för rättvis användning eller TDM, kan användning av olagligt förvärvad data leda till betydande böter.

AI-företag har i allt högre grad ingått licensavtal med upphovsrättsinnehavare för att få tillgång till innehåll. OpenAI har till exempel ingått avtal med olika medieföretag, och andra leverantörer följer efter. Anthropic-rättegången skulle kunna påskynda denna trend och leda till en etablerad licensmarknad.

För leverantörer av AI-modeller och AI-system är det avgörande att använda pålitliga leverantörer för att generera träningsdata, eftersom dessa leverantörer respekterar andras immateriella rättigheter när de skapar data. Även utan kännedom om upphovsrättsintrång kan rättsliga konsekvenser uppstå.

Hur kommer marknaden för AI-utbildningsdata att utvecklas?

Håller en ny licensmarknad på att växa fram för AI-utbildningsdata? Anthropic-fallet och liknande stämningar tyder på att en strukturerad marknad för licensiering av innehåll för AI-utbildning skulle kunna vara under utveckling. Utgivare, författare och andra rättighetsinnehavare inser i allt högre grad värdet av sitt innehåll för AI-utveckling.

Samtidigt står AI-företag inför utmaningen att skaffa högkvalitativ och juridiskt korrekt utbildningsdata. Kostnaderna för sådana licenser kan vara betydande, särskilt för mindre företag som saknar resurserna hos Anthropic eller OpenAI.

Utvecklingen av specialiserade dataleverantörer som skapar och licensierar juridiskt kompatibla utbildningsdataset är en logisk följd av denna trend. Dessa leverantörer skulle kunna fungera som mellanhänder mellan rättighetsinnehavare och AI-utvecklare och säkerställa att alla rättsliga krav uppfylls.

Vilken inverkan kommer detta att ha på innovation och konkurrens?

Hindrar det strängare rättsliga ramverket innovation inom AI-utveckling? Denna fråga är föremål för mycket debatt. Förespråkare för strikta upphovsrättsregler menar att skapare och rättighetsinnehavare bör få adekvat ersättning för användningen av deras verk. Den stora mängden träningsdata som krävs och de därmed sammanhängande licenskostnaderna kan dock leda till en koncentration av marknaden i händerna på ett fåtal stora leverantörer.

Mindre företag och startups kanske inte har råd med de nödvändiga licenserna, vilket skulle begränsa deras förmåga att utveckla konkurrenskraftiga AI-modeller. Paradoxalt nog skulle detta kunna leda till mindre innovation och mindre konkurrens, eftersom endast välfinansierade företag som Anthropic, OpenAI eller Google kan anskaffa de nödvändiga resurserna.

Å andra sidan skulle behovet av att betala licensavgifter kunna leda till effektivare utbildningsmetoder. AI-utvecklare kan investera mer i tekniker som kräver mindre data eller använda syntetiska data för att minska sitt beroende av licensierat innehåll.

Hur positionerar sig rättighetsinnehavare och kreativa yrkesverksamma?

Vilka strategier använder författare, förläggare och andra rättighetsinnehavare? Copyright Initiative och liknande organisationer efterlyser större hänsyn till upphovsrätt i AI-utbildning. De menar att det utgör "storskalig stöld av immateriella rättigheter" när AI-företag använder upphovsrättsskyddade verk utan samtycke eller ersättning.

Många upphovsrättsinnehavare förlitar sig i allt högre grad på mekanismer för att välja bort verktyg för att skydda sina verk från oönskad AI-användning. Samtidigt utforskar de sätt att dra nytta av AI-utveckling genom licensavtal. Detta leder till en komplex blandning av juridiska tvister och affärsmöjligheter.

GEMA:s stämning mot OpenAI visar att upphovsrättsorganisationer också spelar en aktiv roll i denna tvist. Som kollektiv skulle de kunna representera sina medlemmars intressen och föra licensförhandlingar med AI-företag.

Vilka är de långsiktiga utsikterna?

Hur kan det rättsliga landskapet utvecklas under de kommande åren? Anthropic-fallet kan bara vara början på en våg av förlikningar och domstolsbeslut som omdefinierar reglerna för AI-utbildning. I USA kan ytterligare fall förtydliga doktrinen om rättvis användning gällande AI, medan den praktiska tillämpningen av TDM-begränsningar fortsätter att förfinas i Europa.

EU:s AI-förordning kommer sannolikt att ge ytterligare förtydliganden gällande dokumentationskrav och efterlevnad av upphovsrättsregler. Detta skulle kunna leda till en harmonisering av praxis inom EU, men också till skillnader jämfört med andra jurisdiktioner.

Teknologisk utveckling kommer att vara en nyckelfaktor: Om AI-modeller kan tränas effektivt med mindre data eller med syntetisk data i framtiden, skulle detta kunna lindra upphovsrättsproblem. Samtidigt skulle nya tekniker för att upptäcka och kompensera för användningen av upphovsrättsskyddat innehåll kunna utvecklas.

Anthropic-fallet markerar en betydande vändpunkt i utvecklingen av AI-industrin. Det visar att den rättsliga ramen för utbildning av AI-modeller ännu inte är helt tydlig och att både AI-företag och rättighetsinnehavare måste hitta nya sätt att förena sina intressen. Förlikningen på 1,5 miljarder dollar kan vara början på en ny era där användningen av upphovsrättsskyddat innehåll för AI-utbildning sker på en rättvisare och mer transparent grund.

Datasäkerhet i EU/DE | Integrering av en oberoende och källöverskridande AI-plattform för alla affärsbehov

Oberoende AI-plattformar som ett strategiskt alternativ för europeiska företag - Bild: Xpert.Digital

AI-spelförändrare: Den mest flexibla AI-plattformen - Skräddarsydda lösningar som minskar kostnader, förbättrar dina beslut och ökar effektiviteten

Oberoende AI-plattform: Integrerar alla relevanta företagsdatakällor

Snabb AI-integration: Skräddarsydda AI-lösningar för företag på timmar eller dagar, istället för månader
Flexibel infrastruktur: Molnbaserat eller hosting i eget datacenter (Tyskland, Europa, fritt val av plats)

Maximal datasäkerhet: dess användning i advokatbyråer är ett obestridligt bevis
Implementering över en mängd olika företagsdatakällor
Val av egna eller olika AI-modeller (Tyskland, EU, USA, Kanada)

Mer information här:

Oberoende AI-plattformar kontra hyperskalare: Vilken lösning passar bäst?

Vi finns här för dig - Konsulttjänster - Planering - Implementering - Projektledning

☑️ Stöd till små och medelstora företag inom strategi, konsultation, planering och implementering

☑️ Skapande eller omstrukturering av AI-strategin

☑️ Pionjär inom affärsutveckling

Konrad Wolfenstein

Jag skulle gärna fungera som din personliga rådgivare.

Du kan kontakta mig genom att fylla i kontaktformuläret nedan eller helt enkelt ringa mig på +49 7348 4088 965 .

Jag ser fram emot vårt gemensamma projekt.

Skriv till mig

➡️ Förfrågan om videosamtal 👩👱

Xpert.Digital - Konrad Wolfenstein

Xpert.Digital är ett nav för industrin med fokus på digitalisering, maskinteknik, logistik/intralogistik och solceller.

Med vår 360° affärsutvecklingslösning stödjer vi välrenommerade företag från nya affärer till eftermarknadsförsäljning.

Marknadsinformation, smarketing, marknadsautomation, innehållsutveckling, PR, utskick, personliga sociala medier och lead nurturing är en del av våra digitala verktyg.

Du hittar mer information på: www.xpert.digital - www.xpert.solar - www.xpert.plus

Håll kontakten