
3 000 dollar per bok: AI-företaget Anthropic betalar 1,5 miljarder dollar till författare i upphovsrättstvist – Bild: Xpert.Digital
Antropik och miljarduppgörelsen: Ett paradigmskifte inom AI-upphovsrätt
Vad betyder det antropiska fallet för AI-industrin?
Varför gick AI-företaget Anthropic med på att betala upphovsmän 1,5 miljarder dollar, trots att det kan vara lagligt att träna AI-modeller med upphovsrättsskyddade verk? Denna fråga upptar just nu hela teknikbranschen, då fallet kan markera en vändpunkt i konflikten mellan AI-utvecklare och rättighetsinnehavare.
Fallet är särskilt anmärkningsvärt eftersom Anthropic, leverantören av chatboten Claude, inte stämdes för att ha använt upphovsrättsskyddade böcker för att träna sin AI, utan för hur de erhöll dessa data. Den amerikanska domstolen fann att medan träning av en AI med upphovsrättsskyddade texter under vissa omständigheter kunde omfattas av den amerikanska principen om rättvis användning, så var det inte nedladdning av innehållet från olagliga källor. Den avgörande punkten var att Anthropic bevisligen kände till informationens olagliga ursprung.
Lämplig för detta:
Hur kom denna historiska överenskommelse till?
Vilka var de specifika anklagelserna mot Anthropic? Författarna anklagade företaget för att ha laddat ner cirka 500 000 böcker och texter utan tillstånd från två upphovsrättsintrångande onlinedatabaser. Denna data användes sedan för att träna AI-chattroboten Claude, som anses vara en av huvudkonkurrenterna till OpenAI:s ChatGPT.
Förlikningen föreskriver att Anthropic ska betala cirka 3 000 dollar i ersättning för varje berört verk – cirka 2 500 euro. Detta belopp är fyra gånger det lagstadgade minimibeloppet för skadestånd enligt amerikansk upphovsrättslag. Dessutom måste Anthropic förstöra de piratkopierade dokumenten och alla kopior, men behåller rättigheterna till lagligt förvärvade och skannade böcker.
Varför gick Anthropic med på denna förlikning? Företaget ville undvika en rättegång som kunde ha resulterat i böter på upp till 150 000 dollar per bok. Med 500 000 berörda böcker skulle detta ha resulterat i en potentiell utbetalning på upp till 75 miljarder dollar – en livshotande summa även för ett företag som nyligen samlade in 13 miljarder dollar.
Vad är skillnaden mellan den rättsliga situationen i USA och Tyskland?
Hur skulle ett liknande fall bedömas i Tyskland? Till skillnad från amerikansk lag har tysk upphovsrättslagstiftning ingen doktrin om rättvis användning som möjliggör flexibel bedömning från fall till fall. Istället definieras tydligt specifika begränsningar för specifika ändamål som begränsar upphovsmännens rättigheter.
I och med implementeringen av EU:s upphovsrättsdirektiv skapade Tyskland paragraf 44b i upphovsrättslagen (UrhG), som reglerar så kallad text- och datautvinning (TDM). Denna bestämmelse tillåter automatiserad analys av stora mängder data – oavsett om det är text eller bilder – för att utvinna information från dem. Utbildning av en AI faller generellt sett under denna förordning.
Men vilka begränsningar gäller för kommersiella leverantörer? Tillståndet för TDM har en avgörande hake: Rättighetsinnehavare kan invända mot användningen av deras verk för kommersiell TDM. Denna så kallade reservation för användning måste göras i maskinläsbar form, till exempel i metadata eller användarvillkoren för en webbplats.
EU:s DSM-direktiv skiljer mellan två typer av text- och datautvinning: Artikel 3 tillåter TDM för vetenskapliga forskningsändamål av forskningsinstitutioner och kulturarvsinstitutioner, förutsatt att de har laglig tillgång till verken. Detta undantag är obligatoriskt och kan inte uteslutas genom avtalsklausuler. Artikel 4, å andra sidan, tillåter generell TDM för alla ändamål, inklusive kommersiella, men med den viktiga begränsningen av opt-out-förfarandet.
Vilka tekniska aspekter spelar roll i den juridiska bedömningen?
Varför är den tekniska funktionen hos AI-utbildning så viktig för juridisk bedömning? En nyligen genomförd studie av Copyright Initiative, utförd av professor Tim W. Dornis och professor Sebastian Stober, belyser den svarta lådan inom AI-utbildning. Forskarna drar slutsatsen att utbildning av generativa AI-modeller, tekniskt sett, inte är klassisk text- och datautvinning, utan snarare utgör en form av upphovsrättsintrång.
Vad händer tekniskt sett under träningen av AI-modeller? Processen involverar flera steg som omfattas av upphovsrättslagen: Först samlas data systematiskt in, vilket redan utgör dubbelarbete enligt upphovsrättslagen. Därefter lagras den insamlade datan på servrar och förbereds för träning. Slutligen analyserar AI-modellen data och extraherar mönster, stilar och information.
En särskilt kritisk punkt är så kallad memorering: Träningsdata memoreras helt eller delvis av nuvarande generativa modeller och kan därför regenereras och replikeras med lämpliga uppmaningar från slutanvändare. Detta går långt utöver ren analys, vilket är fokus för traditionell text- och datautvinning.
Hur positionerar sig Claude i konkurrensen med ChatGPT?
Vilken inverkan har upphovsrättstvisten på Anthropics marknadsposition? Trots de juridiska problemen har Claude etablerat sig som en seriös konkurrent till ChatGPT. Enligt aktuella marknadsanalyser har Anthropic nu 32 procent av marknadsandelen för stora språkmodeller i företag, medan OpenAI ligger på andra plats med 25 procent.
Anthropics position är särskilt stark inom programmeringsområdet: Med en marknadsandel på 42 procent är företaget den klart största leverantören där, mer än dubbelt så mycket som OpenAIs 21 procent. Claude har främst sin dominans tack vare sitt imponerande kontextfönster på 200 000 tokens, vilket möjliggör bearbetning av hela affärsrapporter i ett enda steg.
Vilka är Claudes specifika styrkor jämfört med ChatGPT? Claude hyllas ofta för sin mer "mänskliga" kommunikation och nyanserade förståelse av komplexa koncept. Dess fokus på etisk AI-utveckling och säkerhet har etablerat Anthropic som en betrodd leverantör för företag som lägger särskild vikt vid ansvarsfullt beteende i känsliga applikationer.
Anthropic förlitar sig på konstitutionell AI, en process som integrerar etiska riktlinjer direkt i sina modeller. Detta hjälper till att förhindra skadlig eller partisk utdata och bygger upp en hög nivå av förtroende hos användarna. Även om OpenAI också arbetar med AI-säkerhet, ger Anthropics uttryckliga engagemang för att utveckla etiskt orienterade AI-modeller dem en betydande fördel.
Vilka andra stämningar påverkar AI-branschen?
Är Anthropic-fallet bara toppen av isberget? Faktum är att det finns över 40 stämningar pågående mot leverantörer av AI-teknik i USA för upphovsrättsintrång. OpenAI, till exempel, stämdes av New York Times, och ytterligare stämningar pågår mot Anthropic efter denna förlikning, bland annat från musikförlag och onlineplattformen Reddit.
Apple har också nyligen blivit måltavla för upphovsrättsstämningar: Författare har stämt teknikföretaget för att de påstått olagligt har använt deras upphovsrättsskyddade böcker för att träna deras AI-system. Kärandena anklagar Apple för att ha kopierat de upphovsrättsskyddade verken utan samtycke, tillskrivning eller ersättning.
I Tyskland är GEMA den första upphovsrättsorganisationen i världen att stämma OpenAI för olicensierad användning av skyddade musikaliska verk. GEMA anklagar OpenAI för att reproducera skyddade sångtexter av tyska upphovsmän utan att skaffa licenser eller kompensera upphovsmännen.
Hur utvecklas frågan om att välja bort?
Vad innebär opt-out-förfarandet i praktiken för rättighetsinnehavare? Enligt tysk lag kan upphovsmän och rättighetsinnehavare deklarera en maskinläsbar användningsbegränsning för att utesluta deras verk från TDM-användning. Till exempel har Sony Music Group publicerat en "Declaration of AI Training Opt Out" för att skydda sitt innehåll från obehörig AI-användning.
Det praktiska genomförandet av opt-out-mekanismen är dock komplext: exakt hur ett sådant förbehåll måste förklaras tekniskt och juridiskt giltigt, och hur AI-utvecklare ska hantera det, har ännu inte slutgiltigt klarlagts. Det finns oro för att ett allmänt använt opt-out avsevärt skulle kunna begränsa träningsdata för AI-modeller i Europa.
AI-företag måste respektera dessa användningsrestriktioner och får inte kringgå dem. Om ett verk ska bli en del av träningsdatakorpusen trots restriktionerna måste utvecklaren inleda licensförhandlingar med rättighetsinnehavaren. Detta kommer att skapa en ny licensmarknad, som dock ännu inte är etablerad.
En ny dimension av digital transformation med 'Managed AI' (Artificial Intelligence) - Plattform & B2B-lösning | Xpert Consulting
En ny dimension av digital transformation med 'Managed AI' (Artificial Intelligence) – Plattform & B2B-lösning | Xpert Consulting - Bild: Xpert.Digital
Här får du lära dig hur ditt företag kan implementera skräddarsydda AI-lösningar snabbt, säkert och utan höga inträdesbarriärer.
En Managed AI-plattform är ditt heltäckande och bekymmersfria paket för artificiell intelligens. Istället för att behöva hantera komplex teknik, dyr infrastruktur och långa utvecklingsprocesser får du en nyckelfärdig lösning skräddarsydd efter dina behov från en specialiserad partner – ofta inom några dagar.
De viktigaste fördelarna i korthet:
⚡ Snabb implementering: Från idé till operativ tillämpning på dagar, inte månader. Vi levererar praktiska lösningar som skapar omedelbart värde.
🔒 Maximal datasäkerhet: Dina känsliga uppgifter stannar hos dig. Vi garanterar säker och korrekt behandling utan att dela data med tredje part.
💸 Ingen ekonomisk risk: Du betalar bara för resultat. Höga initiala investeringar i hårdvara, mjukvara eller personal elimineras helt.
🎯 Fokusera på din kärnverksamhet: Koncentrera dig på det du gör bäst. Vi hanterar hela den tekniska implementeringen, driften och underhållet av din AI-lösning.
📈 Framtidssäkert och skalbart: Din AI växer med dig. Vi säkerställer kontinuerlig optimering och skalbarhet och anpassar modellerna flexibelt till nya krav.
Mer om detta här:
Licensmarknaden för AI-data: möjlighet för utgivare eller risk för startups?
Vilken roll spelar EU:s AI-förordning?
Hur påverkar EU:s nya AI-förordning upphovsrättslagen? Även om AI-förordningen inte innehåller några nya bestämmelser om undantag från upphovsrättslagen, förtydligar den att användning av upphovsrättsskyddat innehåll kräver rättighetsinnehavarens tillstånd, såvida inte en begränsning gäller.
Alla leverantörer av generella AI-modeller måste uppfylla omfattande dokumentationskrav. Detta inkluderar en detaljerad beskrivning av de data som används för utbildning, inklusive datatyp och ursprung samt bearbetningsmetoder. De måste särskilt säkerställa identifiering och efterlevnad av rättsliga reservationer enligt DSM-direktivet.
Kontoret för artificiell intelligens övervakar efterlevnaden av dessa bestämmelser, men granskar inte upphovsrättsintrång verk för verk. Genom att hänvisa till DSM-direktivet förtydligar AI-förordningen att lagstiftaren antar att undantaget för text- och datautvinning gäller för träning av generativa AI-modeller.
Lämplig för detta:
Hur skiljer sig vetenskaplig och kommersiell användning åt?
Vilka särskilda regler gäller för vetenskaplig forskning? I ett banbrytande beslut beslutade Hamburgs regionala domstol att forskningsorganisationer, under vissa förutsättningar, får använda upphovsrättsskyddade verk för att träna artificiell intelligens. Fallet gällde användningen av en upphovsrättsskyddad bild av en forskningsorganisation som hade skapat en omfattande bild-text-datauppsättning för att träna generativa AI-modeller.
Domstolen beslutade att skapandet av en AI-utbildningsdatauppsättning kan falla under forskningsfriheten, även om kommersiella företag senare använder den data som erhållits på detta sätt. Den avgörande punkten är att det initiala skapandet av datauppsättningen tjänar till att inhämta kunskap. Termen "vetenskaplig forskning" tolkas brett i detta sammanhang.
Paragraf 60d i den tyska upphovsrättslagen (UrhG) tillåter vetenskaplig text- och datautvinning av forskningsinstitutioner som universitet för icke-kommersiell vetenskaplig forskning. Samtycke från rättighetsinnehavarna krävs inte. Detta står i kontrast till kommersiell användning, där opt-out-förfarandet gäller.
Vilka internationella skillnader finns det?
Hur hanterar andra länder frågan om upphovsrätt inom AI? Japan anses vara särskilt innovationsvänligt och ändrade redan sin upphovsrättslag 2018. Artikel 30-4 i den japanska upphovsrättslagen inför ett flexibelt undantag för användning som inte är för att "njuta" verket. Detta tolkas ofta som att inkludera träning av AI-modeller, så länge målet är dataanalys och inte konsumtion av själva verket.
Storbritannien har gått sin egen väg efter Brexit. Det har hållits samråd om upphovsrättsundantag för AI-utvecklare, särskilt för TDM. Förslagen mötte dock betydande farhågor från de kreativa näringarna, så den framtida inriktningen är fortfarande osäker.
Kina ändrade sin upphovsrättslag 2020, vilket generellt stärkte skyddet av immateriella rättigheter. Specifika regler för AI-utbildning är fortfarande under utveckling, men landet inser AI:s strategiska betydelse och förväntas söka pragmatiska lösningar.
Vad betyder fallet för andra AI-företag?
Vilka lärdomar kan andra AI-företag dra av Anthropic-fallet? Jämförelsen visar att utbildningsdatans ursprung är avgörande. Medan utbildning med lagligt förvärvad data kan omfattas av hinder för rättvis användning eller TDM, kan användningen av olagligt förvärvad data resultera i betydande böter.
AI-företag har i allt större utsträckning ingått licensavtal med upphovsrättsinnehavare för att få tillgång till innehåll. OpenAI har till exempel tecknat avtal med olika medieföretag, och andra leverantörer följer efter. Anthropic-uppgörelsen skulle kunna påskynda denna utveckling och leda till en etablerad licensmarknad.
Det är avgörande för leverantörer av AI-modeller och AI-system att använda betrodda leverantörer när de genererar träningsdata, som respekterar andras immateriella rättigheter när de skapar data. Även om det inte finns någon kännedom om upphovsrättsintrång kan rättsliga konsekvenser uppstå.
Hur kommer marknaden för AI-utbildningsdata att utvecklas?
Håller en ny licensmarknad för AI-utbildningsdata på att växa fram? Anthropic-fallet och liknande stämningar tyder på att en strukturerad marknad för licensiering av innehåll för AI-utbildning kan vara på väg att växa fram. Utgivare, författare och andra rättighetsinnehavare inser i allt högre grad värdet av sitt innehåll för AI-utveckling.
Samtidigt står AI-företag inför utmaningen att skaffa högkvalitativ och juridiskt sund utbildningsdata. Kostnaderna för sådana licenser kan vara betydande, särskilt för mindre företag som saknar resurserna hos Anthropic eller OpenAI.
Framväxten av specialiserade dataleverantörer som skapar och licensierar juridiskt kompatibla utbildningsdataset är en logisk följd av denna utveckling. Dessa leverantörer skulle kunna fungera som mellanhänder mellan rättighetsinnehavare och AI-utvecklare och säkerställa att alla rättsliga krav uppfylls.
Vilken inverkan har detta på innovation och konkurrens?
Hindrar den skärpta rättsliga situationen innovation inom AI-utveckling? Denna fråga är kontroversiell. Förespråkare för strikta upphovsrättsregler menar att kreatörer och rättighetsinnehavare bör få en rättvis ersättning för användningen av sina verk. Den stora mängden träningsdata som krävs och de därmed sammanhängande licenskostnaderna kan dock leda till en koncentration av marknaden bland ett fåtal stora leverantörer.
Mindre företag och startups skulle inte ha råd med de nödvändiga licenserna, vilket skulle begränsa deras förmåga att utveckla konkurrenskraftiga AI-modeller. Paradoxalt nog skulle detta kunna leda till mindre innovation och mindre konkurrens, eftersom endast välfinansierade företag som Anthropic, OpenAI eller Google kan tillhandahålla de nödvändiga resurserna.
Å andra sidan skulle behovet av att betala licensavgifter kunna leda till effektivare utbildningsmetoder. AI-utvecklare skulle kunna investera mer i tekniker som kräver mindre data eller använda syntetiska data för att minska sitt beroende av licensierat innehåll.
Hur positionerar sig rättighetsinnehavare och kreatörer?
Vilka strategier använder författare, förläggare och andra rättighetsinnehavare sig av? Copyright Initiative och liknande organisationer efterlyser större hänsyn till upphovsrätt i AI-utbildning. De menar att AI-företag som använder upphovsrättsskyddade verk utan samtycke och ersättning utgör "storskalig stöld av immateriella rättigheter".
Många rättighetsinnehavare förlitar sig i allt högre grad på mekanismer för att välja bort verktyg för att skydda sina verk från oönskad AI-användning. Samtidigt utforskar de sätt att dra nytta av AI-utveckling genom licensavtal. Detta leder till en komplex blandning av juridiska tvister och affärsmöjligheter.
GEMA:s stämning mot OpenAI visar att även upphovsrättsorganisationer spelar en aktiv roll i denna tvist. Som kollektiv skulle de kunna förena sina medlemmars intressen och föra licensförhandlingar med AI-företag.
Vilka är de långsiktiga utsikterna?
Hur kan den rättsliga situationen utvecklas under de kommande åren? Anthropic-fallet kan bara vara början på en våg av förlikningar och domstolsbeslut som omdefinierar reglerna för AI-utbildning. I USA kan ytterligare fall förtydliga doktrinen om rättvis användning med avseende på AI, medan den praktiska tillämpningen av TDM-begränsningarna i Europa förfinas ytterligare.
EU:s AI-förordning kommer sannolikt att ge ytterligare förtydliganden gällande dokumentationskrav och efterlevnad av upphovsrättsregler. Detta skulle kunna leda till harmonisering av praxis inom EU, men också till skillnader med andra jurisdiktioner.
Teknologisk utveckling kommer att vara en viktig faktor: Om AI-modeller kan tränas effektivt med mindre data eller med syntetisk data i framtiden, skulle detta kunna mildra upphovsrättsproblemet. Samtidigt skulle nya tekniker för att upptäcka och kompensera för användningen av upphovsrättsskyddat innehåll kunna utvecklas.
Anthropic-fallet markerar en viktig vändpunkt i utvecklingen av AI-industrin. Det visar att den rättsliga ramen för utbildning av AI-modeller ännu inte är helt klarlagd och att både AI-företag och rättighetsinnehavare måste hitta nya sätt att förena sina intressen. Förlikningen på 1,5 miljarder dollar kan markera början på en ny era där användningen av upphovsrättsskyddat innehåll för AI-utbildning sker på en mer rättvis och transparent grund.
Datasäkerhet i EU/DE | Integrering av en oberoende och dataövergripande AI-plattform för alla affärsbehov
Oberoende AI-plattformar som ett strategiskt alternativ för europeiska företag - Bild: Xpert.Digital
Ki-Gamechanger: De mest flexibla AI-plattforms-tailor-tillverkade lösningarna som minskar kostnaderna, förbättrar deras beslut och ökar effektiviteten
Oberoende AI -plattform: Integrerar alla relevanta företagsdatakällor
- Snabb AI-integration: Skräddarsydd AI-lösningar för företag i timmar eller dagar istället för månader
- Flexibel infrastruktur: molnbaserad eller värd i ditt eget datacenter (Tyskland, Europa, gratis val av plats)
- Högsta datasäkerhet: Användning i advokatbyråer är säkra bevis
- Användning över ett brett utbud av företagsdatakällor
- Val av dina egna eller olika AI -modeller (DE, EU, USA, CN)
Mer om detta här:
Vi är där för dig - Råd - Planering - Implementering - Projektledning
☑ SME -stöd i strategi, rådgivning, planering och implementering
☑ Skapande eller omjustering av AI -strategin
☑ Pioneer Business Development
Jag hjälper dig gärna som personlig konsult.
Du kan kontakta mig genom att fylla i kontaktformuläret nedan eller helt enkelt ringa mig på +49 89 674 804 (München) .
Jag ser fram emot vårt gemensamma projekt.
Xpert.digital - Konrad Wolfenstein
Xpert.Digital är ett nav för bransch med fokus, digitalisering, maskinteknik, logistik/intralogistik och fotovoltaik.
Med vår 360 ° affärsutvecklingslösning stöder vi välkända företag från ny verksamhet till efter försäljning.
Marknadsintelligens, smarketing, marknadsföringsautomation, innehållsutveckling, PR, postkampanjer, personliga sociala medier och blyomsorg är en del av våra digitala verktyg.
Du kan hitta mer på: www.xpert.digital - www.xpert.solar - www.xpert.plus