3000 доларів за книгу: компанія зі штучним інтелектом Anthropic виплачує авторам 1,5 мільярда доларів у суперечці щодо авторських прав

Konrad Wolfenstein

11 місяців тому

3000 доларів за книгу: компанія зі штучним інтелектом Anthropic виплачує авторам 1,5 мільярда доларів у суперечці щодо авторських прав – Зображення: Xpert.Digital

Anthropic та мільярдна угода: зміна парадигми в законодавстві про авторське право на штучний інтелект

Що означає випадок Anthropic для індустрії штучного інтелекту?

Чому компанія Anthropic, що займається штучним інтелектом, погодилася на угоду з авторами на суму 1,5 мільярда доларів, навіть попри те, що навчання моделей ШІ на творах, захищених авторським правом, може бути законним? Це питання зараз хвилює всю технологічну індустрію, оскільки ця справа може стати поворотним моментом у конфлікті між розробниками ШІ та власниками авторських прав.

Ця справа особливо варта уваги, оскільки Anthropic, постачальника чат-бота Claude, було подано до суду не за використання книг, захищених авторським правом, для навчання свого штучного інтелекту, а за спосіб отримання цих даних. Суд США постановив, що хоча навчання штучного інтелекту за допомогою текстів, захищених авторським правом, за певних обставин може підпадати під дію американської доктрини добросовісного використання, завантаження контенту з незаконних джерел не підпадає під неї. Найголовніше, що Anthropic явно знала про незаконне походження даних.

Пов'язано з цим:

Антропний та ШІ Клод: Зростання гіганта ШІ – оцінка, конкуренція та етичні бачення

Як виникла ця історична угода?

Які ж були конкретні звинувачення проти Anthropic? Автори звинуватили компанію у завантаженні приблизно 500 000 книг і текстів без дозволу з двох онлайн-баз даних, що порушують авторські права. Ці дані потім були використані для навчання чат-бота на базі штучного інтелекту Claude, який вважається одним із головних конкурентів ChatGPT від OpenAI.

Згідно з угодою, Anthropic виплатить приблизно 3000 доларів США компенсації за кожен пошкоджений твір, що приблизно еквівалентно 2500 євро. Ця сума в чотири рази перевищує мінімальні встановлені законом збитки згідно із законом США про авторське право. Крім того, Anthropic повинна знищити піратські документи та всі копії, але зберігає права на законно придбані та відскановані книги.

Чому Anthropic погодилася на цю угоду? Компанія хотіла уникнути судового позову, який міг би призвести до штрафів до 150 000 доларів за кожну книгу. З огляду на те, що це торкнулося 500 000 творів, це призвело б до потенційної виплати до 75 мільярдів доларів – непосильна сума навіть для компанії, яка нещодавно залучила 13 мільярдів доларів.

Які відмінності між правовою ситуацією в США та в Німеччині?

Як би розглядався подібний випадок у Німеччині? На відміну від американського законодавства, німецьке законодавство про авторське право не визнає доктрини добросовісного використання, яка дозволяє гнучку оцінку в кожному окремому випадку. Натомість, для конкретних цілей чітко визначені конкретні обмеження та винятки, що обмежують права власників авторських прав.

З впровадженням Директиви ЄС про авторське право Німеччина створила Розділ 44b Закону про авторське право, який регулює так званий інтелектуальний аналіз тексту та даних (TDM). Це положення дозволяє автоматизований аналіз великих наборів даних — тексту чи зображень — для вилучення інформації. Навчання штучного інтелекту загалом підпадає під дію цього положення.

Які обмеження застосовуються до комерційних постачальників? Ліцензія TDM має один суттєвий недолік: власники авторських прав можуть заперечувати проти використання своїх творів для комерційного TDM. Це так зване резервування використання має бути у машинозчитуваній формі, наприклад, у метаданих або умовах обслуговування веб-сайту.

Директива ЄС про цифровий та цифровий аналіз тексту та даних розрізняє два типи інтелектуального аналізу тексту та даних: стаття 3 дозволяє використання TDM для науково-дослідних цілей дослідницькими установами та установами культурної спадщини за умови, що вони мають законний доступ до творів. Цей виняток є обов'язковим і не може бути виключений договірними положеннями. Стаття 4, з іншого боку, дозволяє загальний TDM для будь-яких цілей, включаючи комерційні, але з важливим обмеженням процедури відмови.

Які технічні аспекти відіграють роль у юридичній оцінці?

Чому технічні аспекти навчання ШІ такі важливі для юридичної оцінки? Нещодавнє дослідження Ініціативи з авторського права, проведене професором Тімом В. Дорнісом та професором Себастьяном Стобером, проливає світло на чорну скриньку навчання ШІ. Дослідники дійшли висновку, що, з технічної точки зору, навчання генеративних моделей ШІ не є класичним текстовим та дата-майнінгом, а радше формою порушення авторських прав.

Що відбувається технічно під час навчання моделей ШІ? Процес включає кілька кроків, пов'язаних з авторським правом: Спочатку дані систематично збираються, що вже є відтворенням згідно із законом про авторське право. Потім зібрані дані зберігаються на серверах і готуються до навчання. Нарешті, модель ШІ аналізує дані та витягує шаблони, стилі та інформацію.

Особливо критичним моментом є так зване запам'ятовування: навчальні дані частково або повністю запам'ятовуються сучасними генеративними моделями і тому можуть бути регенеровані та, таким чином, відтворені кінцевими користувачами за допомогою відповідних підказок. Це виходить далеко за рамки простого аналізу, який є фокусом класичного текстового та дата-мікробного аналізу.

Як Claude позиціонує себе в конкуренції з ChatGPT?

Який вплив має суперечка щодо авторських прав на ринкові позиції Anthropic? Незважаючи на юридичні проблеми, Claude зарекомендував себе як серйозний конкурент ChatGPT. Згідно з поточними ринковими аналізами, Anthropic зараз займає 32 відсотки ринку великих мовних моделей у підприємствах, тоді як OpenAI посідає друге місце з 25 відсотками.

Позиції Anthropic особливо сильні у сфері програмування: з часткою ринку в 42 відсотки компанія є найбільшим постачальником, більш ніж удвічі перевершуючи OpenAI з 21 відсотком. Claude завдячує цьому домінуванню головним чином своєму вражаючому контекстному вікну в 200 000 токенів, яке дозволяє обробляти повні бізнес-звіти за один прохід.

Які конкретні сильні сторони Claude порівняно з ChatGPT? Claude часто хвалять за його більш «людський» стиль спілкування та тонке розуміння складних концепцій. Зосередженість Anthropic на етичній розробці та безпеці штучного інтелекту зробила його надійним постачальником для компаній, які приділяють особливу увагу відповідальній практиці в конфіденційних додатках.

Anthropic спирається на конституційний штучний інтелект – метод, який інтегрує етичні принципи безпосередньо в моделі. Це допомагає запобігти шкідливим або упередженим витратам і формує високий рівень довіри користувачів. Хоча OpenAI також активно займається безпекою штучного інтелекту, чітке зобов'язання Anthropic розробляти етично обґрунтовані моделі штучного інтелекту дає їй значну перевагу.

Які ще судові позови впливають на індустрію штучного інтелекту?

Чи справа Anthropic лише верхівкою айсберга? Фактично, у США розглядається понад 40 позовів проти постачальників технологій штучного інтелекту за порушення авторських прав. Наприклад, на OpenAI подала до суду газета New York Times, і після цієї угоди проти Anthropic тривають подальші позови, зокрема від музичних видавців та онлайн-платформи Reddit.

Apple також нещодавно стала об’єктом позовів щодо авторських прав: автори подали до суду на технологічну компанію, стверджуючи, що вона незаконно використовувала їхні захищені авторським правом книги для навчання своїх систем штучного інтелекту. Позивачі звинувачують Apple у копіюванні захищених творів без дозволу, зазначення авторства чи компенсації.

У Німеччині GEMA стала першою у світі організацією колективного управління, яка подала позов проти OpenAI за неліцензійне використання музичних творів, захищених авторським правом. GEMA звинувачує OpenAI у відтворенні текстів пісень німецьких авторів, захищених авторським правом, без придбання ліцензій або компенсації авторам.

Як розвивається питання відмови?

Що процедура відмови означає на практиці для правовласників? Згідно з німецьким законодавством, автори та правовласники можуть заявити про машинозчитуване застереження щодо використання, щоб виключити свої твори з використання TDM. Наприклад, Sony Music Group опублікувала «Декларацію про відмову від навчання ШІ» для захисту свого контенту від несанкціонованого використання ШІ.

Однак практична реалізація механізму відмови є складною: як саме має бути заявлено таке застереження технічно та юридично ефективним чином, і як розробники ШІ повинні з цим поводитися, ще остаточно не з'ясовано. Існує занепокоєння, що широко використовувана відмова може суттєво обмежити навчальні дані для моделей ШІ в Європі.

Компанії, що займаються штучним інтелектом, повинні дотримуватися цих обмежень використання та не можуть їх обходити. Якщо робота має бути включена до корпусу навчальних даних, незважаючи на ці обмеження, розробник повинен вступити в переговори щодо ліцензування з правовласником. Це призводить до появи нового ринку ліцензування, який, однак, ще не сформований.

Новий вимір цифрової трансформації з «керованим ШІ» (штучним інтелектом) – платформа та рішення B2B | Xpert Consulting

Новий вимір цифрової трансформації з «керованим ШІ» (штучним інтелектом) – платформа та рішення B2B | Xpert Consulting - Зображення: Xpert.Digital

Тут ви дізнаєтеся, як ваша компанія може швидко, безпечно та без високих бар'єрів входу впроваджувати індивідуальні рішення на основі штучного інтелекту.

Керована платформа штучного інтелекту — це ваше комплексне та безтурботне рішення для штучного інтелекту. Замість того, щоб мати справу зі складними технологіями, дорогою інфраструктурою та тривалими процесами розробки, ви отримуєте готове рішення, адаптоване до ваших потреб, від спеціалізованого партнера — часто всього за кілька днів.

Основні переваги з першого погляду:

⚡ Швидке впровадження: від ідеї до готового до використання застосунку за лічені дні, а не місяці. Ми пропонуємо практичні рішення, які створюють негайну додану цінність.

🔒 Максимальна безпека даних: Ваші конфіденційні дані залишаються з вами. Ми гарантуємо безпечну та відповідність вимогам обробку без передачі даних третім особам.

💸 Без фінансових ризиків: Ви платите лише за результат. Повністю виключаються значні початкові інвестиції в обладнання, програмне забезпечення чи персонал.

🎯 Зосередьтеся на своєму основному бізнесі: Зосередьтеся на тому, що ви робите найкраще. Ми подбаємо про повне технічне впровадження, експлуатацію та обслуговування вашого рішення на базі штучного інтелекту.

📈 Орієнтований на майбутнє та масштабований: Ваш ШІ зростає разом з вами. Ми забезпечуємо постійну оптимізацію та масштабованість, а також гнучко адаптуємо моделі до нових вимог.

Більше інформації тут:

Кероване рішення на основі штучного інтелекту – промислові послуги зі штучним інтелектом: ключ до конкурентоспроможності в секторах послуг, промисловості та машинобудування

Ринок ліцензування даних штучного інтелекту: можливості для видавців чи ризики для стартапів?

Яку роль відіграє регулювання ЄС щодо штучного інтелекту?

Як новий Регламент ЄС про ШІ впливає на авторське право? Хоча Регламент про ШІ не містить жодних нових положень щодо винятків з авторського права, він уточнює, що використання контенту, захищеного авторським правом, вимагає дозволу правовласника, якщо не застосовується обмеження.

Усі постачальники моделей штучного інтелекту загального призначення повинні дотримуватися вичерпних вимог до документації. Це включає детальний опис даних, що використовуються для навчання, включаючи тип і походження даних і методи обробки. Зокрема, вони повинні забезпечити ідентифікацію та дотримання правових застережень згідно з Директивою DSM.

Управління штучного інтелекту контролює дотримання цих положень, але не розглядає порушення авторських прав у кожному окремому творі. Посилаючись на Директиву DSM, Регламент про ШІ уточнює, що законодавець припускає застосовність винятку для інтелектуального аналізу тексту та даних до навчання генеративних моделей ШІ.

Пов'язано з цим:

Антропний Клод Гоу: Захоплива розробка штучного інтелекту для національної безпеки США

Чим відрізняється наукове та комерційне використання?

Які спеціальні правила застосовуються до наукових досліджень? У знаковому рішенні Регіональний суд Гамбурга постановив, що дослідницькі організації можуть за певних умов використовувати твори, захищені авторським правом, для навчання штучного інтелекту. Справа стосувалася використання захищеного авторським правом зображення дослідницькою організацією, яка створила великий набір даних зображень і тексту для навчання генеративних моделей ШІ.

Суд постановив, що створення навчального набору даних для штучного інтелекту може підпадати під свободу дослідження, навіть якщо комерційні компанії згодом використовуватимуть отримані таким чином дані. Вирішальним фактором є те, що початкове створення набору даних служить меті отримання знань. Поняття наукового дослідження тлумачиться в цьому контексті широко.

Розділ 60d Закону Німеччини про авторське право (UrhG) дозволяє науково-дослідним установам, таким як університети, використовувати науковий текст і дані для некомерційних наукових досліджень. Згода власників авторських прав для цього не потрібна. Це відрізняється від комерційного використання, де застосовується процедура відмови.

Які існують міжнародні відмінності?

Як інші країни вирішують питання авторського права на штучний інтелект? Японія вважається особливо сприятливою для інновацій і вже внесла зміни до свого закону про авторське право у 2018 році. Стаття 30-4 Закону Японії про авторське право запроваджує гнучкий виняток для використання, яке не служить «отриманню задоволення» від твору. Це часто тлумачиться так, що це також може включати навчання моделей ШІ, якщо метою є аналіз даних, а не споживання самого твору.

Сполучене Королівство обрало власний шлях після Brexit. Були проведені консультації щодо винятків з авторських прав для розробників штучного інтелекту, зокрема для TDM. Однак пропозиції зустріли значні занепокоєння з боку креативних індустрій, що залишило майбутній напрямок неясним.

Китай вніс зміни до свого закону про авторське право у 2020 році та загалом посилює захист інтелектуальної власності. Конкретні правила навчання у сфері штучного інтелекту все ще розробляються, але країна визнає стратегічну важливість штучного інтелекту та очікується пошуку прагматичних рішень.

Що цей випадок означає для інших компаній, що займаються штучним інтелектом?

Які уроки можуть винести інші компанії, що займаються штучним інтелектом, зі справи Anthropic? Порівняння показує, що походження навчальних даних має вирішальне значення. Хоча навчання з використанням законно отриманих даних може підпадати під обмеження добросовісного використання або TDM, використання незаконно отриманих даних може призвести до суттєвих штрафів.

Компанії, що займаються штучним інтелектом, дедалі частіше укладають ліцензійні угоди з власниками авторських прав, щоб отримати доступ до контенту. OpenAI, наприклад, уклав угоди з різними медіакомпаніями, а інші постачальники наслідують цей приклад. Випробування Anthropic може прискорити цю тенденцію та призвести до формування сформованого ринку ліцензування.

Для постачальників моделей штучного інтелекту та систем штучного інтелекту вкрай важливо використовувати надійних постачальників для створення навчальних даних, оскільки ці постачальники поважають інтелектуальну власність інших осіб під час створення даних. Навіть без знання про порушення авторських прав можуть виникнути правові наслідки.

Як розвиватиметься ринок даних для навчання ШІ?

Чи формується новий ринок ліцензування даних для навчання ШІ? Справа Anthropic та аналогічні судові позови свідчать про те, що може розвиватися структурований ринок ліцензування контенту для навчання ШІ. Видавці, автори та інші правовласники дедалі більше усвідомлюють цінність свого контенту для розвитку ШІ.

Водночас компанії, що займаються штучним інтелектом, стикаються з проблемою отримання високоякісних та юридично відповідних навчальних даних. Вартість таких ліцензій може бути значною, особливо для невеликих компаній, яким бракує ресурсів Anthropic або OpenAI.

Розвиток спеціалізованих постачальників даних, які створюють та ліцензують юридично відповідні навчальні набори даних, є логічним наслідком цієї тенденції. Ці постачальники могли б виступати посередниками між правовласниками та розробниками штучного інтелекту, забезпечуючи виконання всіх юридичних вимог.

Який вплив це матиме на інновації та конкуренцію?

Чи перешкоджає суворіша правова база інноваціям у розробці штучного інтелекту? Це питання є предметом численних дискусій. Прихильники суворих правил авторського права стверджують, що творці та правовласники повинні отримувати належну компенсацію за використання своїх творів. Однак великий обсяг необхідних навчальних даних та пов'язані з цим витрати на ліцензування можуть призвести до концентрації ринку в руках кількох великих постачальників.

Менші компанії та стартапи можуть бути не в змозі дозволити собі необхідні ліцензії, що обмежить їхню здатність розробляти конкурентоспроможні моделі штучного інтелекту. Як не парадоксально, це може призвести до меншої інноваційності та конкуренції, оскільки лише добре фінансовані компанії, такі як Anthropic, OpenAI або Google, можуть залучити необхідні ресурси.

З іншого боку, необхідність сплати ліцензійних зборів може призвести до ефективніших методів навчання. Розробники штучного інтелекту можуть інвестувати більше в методи, які потребують менше даних, або використовувати синтетичні дані, щоб зменшити свою залежність від ліцензованого контенту.

Як позиціонують себе правовласники та фахівці творчої сфери?

Які стратегії використовують автори, видавці та інші правовласники? Ініціатива з авторського права та подібні організації закликають до більшого врахування авторського права в навчанні у сфері штучного інтелекту. Вони стверджують, що використання компаній, що займаються штучним інтелектом, творів, захищених авторським правом, без згоди чи компенсації є «масштабною крадіжкою інтелектуальної власності».

Багато власників авторських прав дедалі більше покладаються на механізми відмови для захисту своїх творів від небажаного використання штучного інтелекту. Водночас вони вивчають способи отримання прибутку від розробки штучного інтелекту за допомогою ліцензійних угод. Це призводить до складного поєднання юридичних суперечок та бізнес-можливостей.

Позов GEMA проти OpenAI показує, що товариства колективного управління також відіграють активну роль у цьому спорі. Як колективи, вони могли б представляти інтереси своїх членів та вести переговори щодо ліцензування з компаніями, що займаються штучним інтелектом.

Які довгострокові перспективи?

Як може розвиватися правовий ландшафт у найближчі роки? Справа Anthropic може бути лише початком хвилі врегулювань та судових рішень, які перевизначають правила навчання ШІ. У США подальші справи можуть уточнити доктрину добросовісного використання щодо ШІ, тоді як у Європі практичне застосування обмежень TDM продовжує вдосконалюватися.

Регламент ЄС про штучний інтелект, ймовірно, надасть додаткові роз'яснення щодо вимог до документації та дотримання авторських прав. Це може призвести до гармонізації практики в межах ЄС, але також до відмінностей порівняно з іншими юрисдикціями.

Технологічний розвиток буде ключовим фактором: якщо моделі штучного інтелекту можна буде ефективно навчати з меншою кількістю даних або з використанням синтетичних даних у майбутньому, це може зменшити проблеми з авторським правом. Водночас можуть бути розроблені нові методи виявлення та компенсації за використання контенту, захищеного авторським правом.

Справа Anthropic знаменує собою значний поворотний момент у розвитку індустрії штучного інтелекту. Вона демонструє, що правова база для навчання моделей ШІ ще не повністю зрозуміла, і що як компанії, що займаються ШІ, так і правовласники повинні знайти нові способи узгодження своїх інтересів. Угода на суму 1,5 мільярда доларів може стати початком нової ери, в якій використання контенту, захищеного авторським правом, для навчання ШІ здійснюватиметься на більш справедливій та прозорій основі.

Безпека даних ЄС/Німеччина | Інтеграція незалежної платформи штучного інтелекту з різними джерелами даних для всіх потреб бізнесу

Незалежні платформи штучного інтелекту як стратегічна альтернатива для європейських компаній - Зображення: Xpert.Digital

ШІ, що змінює правила гри: Найгнучкіша платформа ШІ — індивідуальні рішення, що знижують витрати, покращують ваші рішення та підвищують ефективність

Незалежна платформа штучного інтелекту: інтегрує всі відповідні джерела даних компанії

Швидка інтеграція штучного інтелекту: індивідуальні рішення на основі штучного інтелекту для бізнесу за години чи дні, а не за місяці
Гнучка інфраструктура: хмарна або хостинг у власному центрі обробки даних (Німеччина, Європа, вільний вибір місця розташування)

Максимальна безпека даних: його використання в юридичних фірмах є незаперечним доказом
Розгортання в широкому спектрі корпоративних джерел даних
Вибір власних або різних моделей штучного інтелекту (Німеччина, ЄС, США, Китай)

Більше інформації тут:

Незалежні платформи штучного інтелекту проти гіперскейлерів: яке рішення підходить краще?

Ми тут для вас - Консалтинг - Планування - Впровадження - Управління проектами

☑️ Підтримка МСП у стратегії, консалтингу, плануванні та впровадженні

☑️ Створення або переорієнтація стратегії ШІ

☑️ Розвиток бізнесу Pioneer

Konrad Wolfenstein

Я буду радий служити вашим особистим консультантом.

Ви можете зв'язатися зі мною, заповнивши контактну форму нижче, або просто зателефонувавши мені за номером +49 7348 4088 965 .

Я з нетерпінням чекаю нашого спільного проєкту.

Напиши мені

➡️ Запит на відеодзвінок 👩👱

Xpert.Digital - Konrad Wolfenstein

Xpert.Digital – це галузевий центр, що спеціалізується на цифровізації, машинобудуванні, логістиці/інтралогістиці та фотоелектричній енергетиці.

Завдяки нашому комплексному рішенню для розвитку бізнесу на 360° ми підтримуємо відомі компанії, починаючи від нового бізнесу і закінчуючи післяпродажним обслуговуванням.

Ринкова аналітика, маркетинг, автоматизація маркетингу, розробка контенту, PR, поштові кампанії, персоналізовані соціальні мережі та підтримка лідів – це частина наших цифрових інструментів.

Більше інформації можна знайти за адресами: www.xpert.digital - www.xpert.solar - www.xpert.plus

Залишайтеся на зв'язку