3000 долларов за книгу: компания Anthropic, занимающаяся разработкой искусственного интеллекта, выплатила авторам 1,5 миллиарда долларов в споре об авторских правах

Konrad Wolfenstein

11 месяцев назад

3000 долларов за книгу: компания Anthropic, занимающаяся разработкой искусственного интеллекта, выплатила авторам 1,5 миллиарда долларов в споре об авторских правах – Изображение: Xpert.Digital

Антропогенные факторы и многомиллиардное соглашение: смена парадигмы в законодательстве об авторском праве на ИИ

Что означает дело Anthropic для индустрии искусственного интеллекта?

Почему компания Anthropic, занимающаяся разработкой ИИ, согласилась на урегулирование спора с авторами на сумму 1,5 миллиарда долларов, несмотря на то, что обучение моделей ИИ с использованием защищенных авторским правом произведений может быть законным? Этот вопрос сейчас занимает всю технологическую индустрию, поскольку данное дело может стать поворотным моментом в конфликте между разработчиками ИИ и правообладателями.

Этот случай особенно примечателен тем, что компания Anthropic, разработчик чат-бота Claude, была привлечена к ответственности не за использование защищенных авторским правом книг для обучения своего ИИ, а за способ получения этих данных. Американский суд постановил, что, хотя обучение ИИ с использованием защищенных авторским правом текстов при определенных обстоятельствах может подпадать под действие американской доктрины добросовестного использования, загрузка контента из незаконных источников — нет. Что особенно важно, компания Anthropic, как было доказано, знала о незаконном происхождении данных.

В связи с этим:

Антропология и ИИ. Клод: Восхождение к вершинам ИИ – оценка, конкуренция и этические взгляды

Как было достигнуто это историческое соглашение?

В чём конкретно заключались обвинения в адрес Anthropic? Авторы обвинили компанию в несанкционированном скачивании примерно 500 000 книг и текстов из двух онлайн-баз данных, нарушающих авторские права. Эти данные затем были использованы для обучения чат-бота с искусственным интеллектом Claude, считающегося одним из главных конкурентов ChatGPT от OpenAI.

В соответствии с соглашением, компания Anthropic выплатит приблизительно 3000 долларов в качестве компенсации за каждое поврежденное произведение — что примерно эквивалентно 2500 евро. Эта сумма в четыре раза превышает минимальный размер компенсации, установленный законодательством США об авторском праве. Кроме того, Anthropic обязана уничтожить пиратские документы и все копии, но сохраняет за собой права на законно приобретенные и отсканированные книги.

Почему компания Anthropic согласилась на это соглашение? Компания хотела избежать судебного иска, который мог бы привести к штрафам в размере до 150 000 долларов за каждую книгу. Учитывая, что пострадало 500 000 произведений, это могло бы привести к выплате до 75 миллиардов долларов — непосильной суммы даже для компании, которая недавно привлекла 13 миллиардов долларов инвестиций.

В чём заключаются различия в правовой ситуации в США и Германии?

Как бы рассматривался аналогичный случай в Германии? В отличие от американского права, немецкое авторское право не признает доктрину добросовестного использования, которая допускает гибкую оценку в каждом конкретном случае. Вместо этого, для отдельных целей четко определены конкретные ограничения и исключения, ограничивающие права правообладателей.

В связи с введением в действие Директивы ЕС об авторском праве Германия приняла статью 44b Закона об авторском праве, которая регулирует так называемый анализ текста и данных (TDM). Это положение разрешает автоматизированный анализ больших наборов данных — будь то текст или изображения — для извлечения информации. Обучение ИИ, как правило, подпадает под действие этого положения.

Какие ограничения применяются к коммерческим поставщикам? Лицензия TDM имеет один существенный недостаток: правообладатели могут возражать против использования своих произведений в коммерческих целях TDM. Это так называемое ограничение на использование должно быть оформлено в машиночитаемом формате, например, в метаданных или условиях использования веб-сайта.

Директива ЕС о цифровом моделировании и анализе данных различает два типа анализа текста и данных: статья 3 разрешает анализ текста и данных в научных целях научно-исследовательскими учреждениями и учреждениями культурного наследия при условии, что они имеют законный доступ к произведениям. Это исключение является обязательным и не может быть исключено договорными положениями. Статья 4, с другой стороны, разрешает общий анализ текста и данных для любых целей, включая коммерческие, но с важным ограничением в виде процедуры отказа.

Какие технические аспекты играют роль в правовой оценке?

Почему технические аспекты обучения ИИ так важны для юридической оценки? Недавнее исследование, проведенное Инициативой по защите авторских прав профессором Тимом У. Дорнисом и профессором Себастьяном Стобером, проливает свет на «черный ящик» обучения ИИ. Исследователи пришли к выводу, что, технически говоря, обучение генеративных моделей ИИ — это не классический анализ текста и данных, а скорее форма нарушения авторских прав.

Что технически происходит при обучении моделей ИИ? Процесс включает несколько этапов, имеющих отношение к авторскому праву: Во-первых, систематически собираются данные, что уже является воспроизведением в соответствии с законом об авторском праве. Затем собранные данные сохраняются на серверах и подготавливаются для обучения. Наконец, модель ИИ анализирует данные и извлекает закономерности, стили и информацию.

Особенно важным моментом является так называемое запоминание: современные генеративные модели частично или полностью запоминают обучающие данные, которые, следовательно, могут быть сгенерированы и воспроизведены конечными пользователями с помощью соответствующих подсказок. Это выходит далеко за рамки простого анализа, на котором сосредоточен классический анализ текста и данных.

Как Клод позиционирует себя в конкуренции с ChatGPT?

Какое влияние оказывает спор об авторских правах на рыночные позиции Anthropic? Несмотря на юридические проблемы, Claude зарекомендовал себя как серьезный конкурент ChatGPT. Согласно текущим рыночным анализам, Anthropic в настоящее время занимает 32% рынка больших языковых моделей для предприятий, в то время как OpenAI находится на втором месте с 25%.

Позиции Anthropic особенно сильны в области программирования: с долей рынка в 42 процента компания является крупнейшим поставщиком, более чем вдвое превосходя OpenAI с 21 процентом. Это доминирование Claude обусловлено прежде всего впечатляющим контекстным окном в 200 000 токенов, которое позволяет обрабатывать полные бизнес-отчеты за один проход.

В чём заключаются конкретные преимущества Claude по сравнению с ChatGPT? Claude часто хвалят за более «человечный» стиль общения и тонкое понимание сложных концепций. Ориентация Anthropic на этичную разработку и безопасность ИИ сделала её надёжным поставщиком для компаний, которые уделяют особое внимание ответственным практикам в работе с конфиденциальными приложениями.

Компания Anthropic использует метод «Конституционного ИИ», который интегрирует этические принципы непосредственно в модели. Это помогает предотвратить вредные или предвзятые расходы и способствует высокому уровню доверия пользователей. Хотя OpenAI также активно работает в области безопасности ИИ, четкая приверженность Anthropic разработке этически обоснованных моделей ИИ дает ей значительное преимущество.

Какие еще судебные иски затрагивают индустрию искусственного интеллекта?

Дело Anthropic — это лишь верхушка айсберга? На самом деле, в США рассматривается более 40 исков против поставщиков технологий искусственного интеллекта за нарушение авторских прав. Например, на OpenAI подала в суд газета New York Times, а после этого соглашения против Anthropic возбуждены новые судебные дела, в том числе от музыкальных издателей и онлайн-платформы Reddit.

Компания Apple также недавно стала объектом исков о нарушении авторских прав: авторы подали в суд на технологическую компанию, утверждая, что она незаконно использовала их книги, защищенные авторским правом, для обучения своих систем искусственного интеллекта. Истцы обвиняют Apple в копировании защищенных авторским правом произведений без разрешения, указания авторства или компенсации.

В Германии GEMA стала первой в мире организацией по коллективному управлению авторскими правами, подавшей иск против OpenAI за нелицензионное использование защищенных авторским правом музыкальных произведений. GEMA обвиняет OpenAI в воспроизведении защищенных авторским правом текстов песен немецких авторов без получения лицензий и выплаты компенсаций авторам.

Как развивается ситуация с отказом от участия?

Что на практике означает процедура отказа от использования для правообладателей? Согласно немецкому законодательству, авторы и правообладатели могут заявить о резервировании использования в машиночитаемом формате, чтобы исключить свои произведения из использования в машиночитаемом формате. Например, Sony Music Group опубликовала «Заявление об отказе от использования в обучении ИИ», чтобы защитить свой контент от несанкционированного использования ИИ.

Однако практическая реализация механизма отказа от участия сложна: как именно такое резервирование должно быть оформлено технически и юридически эффективным способом, и как разработчики ИИ должны с ним работать, до сих пор окончательно не выяснено. Существует опасение, что широко используемая возможность отказа от участия может значительно ограничить обучающие данные для моделей ИИ в Европе.

Компании, занимающиеся разработкой ИИ, должны соблюдать эти ограничения на использование и не могут их обходить. Если произведение должно быть включено в корпус обучающих данных, несмотря на эти ограничения, разработчик должен вступить в лицензионные переговоры с правообладателем. Это приводит к появлению нового рынка лицензирования, который, однако, еще не сформирован.

Новое измерение цифровой трансформации с помощью «управляемого ИИ» (искусственного интеллекта) — платформа и B2B-решение | Xpert Consulting

Новое измерение цифровой трансформации с помощью «управляемого ИИ» (искусственного интеллекта) – платформа и B2B-решение | Xpert Consulting - Изображение: Xpert.Digital

Здесь вы узнаете, как ваша компания может быстро, безопасно и без высоких барьеров для входа внедрить индивидуальные решения на основе искусственного интеллекта.

Управляемая платформа искусственного интеллекта — это комплексное и беззаботное решение для вашего бизнеса в сфере искусственного интеллекта. Вместо того чтобы возиться со сложными технологиями, дорогостоящей инфраструктурой и длительными процессами разработки, вы получаете готовое решение, адаптированное под ваши потребности, от специализированного партнера — зачастую всего за несколько дней.

Основные преимущества с первого взгляда:

⚡ Быстрая реализация: от идеи до готового к использованию приложения за считанные дни, а не месяцы. Мы предлагаем практические решения, которые создают немедленную добавленную стоимость.

🔒 Максимальная безопасность данных: Ваши конфиденциальные данные остаются с вами. Мы гарантируем безопасную и соответствующую законодательству обработку данных без их передачи третьим лицам.

💸 Отсутствие финансового риска: вы платите только за результат. Полностью исключаются высокие первоначальные инвестиции в оборудование, программное обеспечение или персонал.

🎯 Сосредоточьтесь на своем основном бизнесе: сконцентрируйтесь на том, что у вас получается лучше всего. Мы берем на себя всю техническую реализацию, эксплуатацию и обслуживание вашего решения на основе ИИ.

📈 Перспективность и масштабируемость: ваш ИИ растет вместе с вами. Мы обеспечиваем непрерывную оптимизацию и масштабируемость, а также гибко адаптируем модели к новым требованиям.

Более подробная информация здесь:

Управляемые решения в области ИИ — Промышленные услуги ИИ: ключ к конкурентоспособности в секторах услуг, промышленности и машиностроения

Рынок лицензирования данных ИИ: возможности для издателей или риски для стартапов?

Какова роль регулирования искусственного интеллекта в ЕС?

Как новый Регламент ЕС об искусственном интеллекте влияет на авторское право? Хотя Регламент об искусственном интеллекте не содержит новых положений, касающихся исключений из авторского права, он уточняет, что использование контента, защищенного авторским правом, требует разрешения правообладателя, если не применяются ограничения.

Все поставщики моделей искусственного интеллекта общего назначения должны соблюдать всеобъемлющие требования к документации. Это включает в себя подробное описание данных, используемых для обучения, включая тип и происхождение данных, а также методы обработки. В частности, они должны обеспечить выявление и соблюдение правовых оговорок в соответствии с Директивой DSM.

Управление по искусственному интеллекту контролирует соблюдение этих положений, но не рассматривает нарушения авторских прав по отдельным произведениям. Ссылаясь на Директиву DSM, Регламент об ИИ уточняет, что законодатель исходит из предположения о применимости исключения, касающегося анализа текста и данных, к обучению генеративных моделей ИИ.

В связи с этим:

Антропоцентричный Клод Гов: Захватывающие разработки в области ИИ для национальной безопасности США

Чем отличаются научное и коммерческое применение?

Какие особые правила применяются к научным исследованиям? В знаменательном решении Гамбургский региональный суд постановил, что исследовательские организации могут при определенных условиях использовать произведения, защищенные авторским правом, для обучения искусственного интеллекта. Дело касалось использования изображения, защищенного авторским правом, исследовательской организацией, которая создала большой набор данных «изображение-текст» для обучения моделей генеративного ИИ.

Суд постановил, что создание обучающего набора данных для ИИ может подпадать под понятие свободы научных исследований, даже если коммерческие компании впоследствии используют полученные таким образом данные. Ключевым фактором является то, что первоначальное создание набора данных служит цели получения знаний. В этом контексте понятие научного исследования толкуется широко.

Статья 60d Закона Германии об авторском праве (UrhG) разрешает научному анализу текстов и данных исследовательскими учреждениями, такими как университеты, для некоммерческих научных исследований. Согласие правообладателей для этого не требуется. Это отличается от коммерческого использования, где применяется процедура отказа от согласия.

Какие существуют международные различия?

Как другие страны решают проблему авторских прав на ИИ? Япония считается особенно благоприятной для инноваций и уже внесла поправки в свой закон об авторском праве в 2018 году. Статья 30-4 Закона об авторском праве Японии вводит гибкое исключение для использования, не связанного с «наслаждением» произведением. Часто это интерпретируется как возможность включения обучения моделей ИИ, если целью является анализ данных, а не потребление самого произведения.

Соединенное Королевство после Брексита пошло своим собственным путем. Были проведены консультации по поводу исключений из авторских прав для разработчиков ИИ, особенно для TDM. Однако эти предложения вызвали значительную обеспокоенность со стороны креативных индустрий, оставив будущее направление неясным.

В 2020 году Китай внес поправки в свое законодательство об авторском праве и в целом усиливает защиту интеллектуальной собственности. Конкретные правила, касающиеся обучения ИИ, все еще находятся в стадии разработки, но страна признает стратегическую важность ИИ и, как ожидается, будет искать прагматичные решения.

Что означает этот случай для других компаний, занимающихся искусственным интеллектом?

Какие уроки могут извлечь другие компании, занимающиеся ИИ, из дела Anthropic? Сравнение показывает, что происхождение обучающих данных имеет решающее значение. В то время как обучение с использованием законно полученных данных может подпадать под ограничения добросовестного использования или TDM, использование незаконно полученных данных может привести к существенным штрафам.

Компании, занимающиеся искусственным интеллектом, все чаще заключают лицензионные соглашения с правообладателями, чтобы получить доступ к контенту. Например, OpenAI заключила сделки с различными медиакомпаниями, и другие поставщики следуют ее примеру. Испытание Anthropic может ускорить эту тенденцию и привести к формированию развитого рынка лицензирования.

Для поставщиков моделей и систем искусственного интеллекта крайне важно использовать надежных поставщиков для генерации обучающих данных, поскольку такие поставщики уважают интеллектуальную собственность других лиц при создании данных. Даже без знания о нарушении авторских прав могут возникнуть юридические последствия.

Как будет развиваться рынок обучающих данных для ИИ?

Формируется ли новый рынок лицензирования данных для обучения ИИ? Дело Anthropic и аналогичные судебные иски указывают на то, что может начать формироваться структурированный рынок лицензирования контента для обучения ИИ. Издатели, авторы и другие правообладатели все чаще осознают ценность своего контента для разработки ИИ.

В то же время компании, занимающиеся искусственным интеллектом, сталкиваются с проблемой получения высококачественных и соответствующих законодательству обучающих данных. Стоимость таких лицензий может быть значительной, особенно для небольших компаний, которым не хватает ресурсов Anthropic или OpenAI.

Логическим следствием этой тенденции является развитие специализированных поставщиков данных, которые создают и лицензируют соответствующие законодательству обучающие наборы данных. Эти поставщики могли бы выступать в качестве посредников между правообладателями и разработчиками ИИ, обеспечивая соблюдение всех юридических требований.

Какое влияние это окажет на инновации и конкуренцию?

Препятствует ли ужесточение правовой базы инновациям в разработке ИИ? Этот вопрос является предметом многочисленных дискуссий. Сторонники строгих правил авторского права утверждают, что создатели и правообладатели должны получать адекватную компенсацию за использование своих произведений. Однако большой объем необходимых обучающих данных и связанные с этим затраты на лицензирование могут привести к концентрации рынка в руках нескольких крупных поставщиков.

Небольшие компании и стартапы могут оказаться не в состоянии позволить себе необходимые лицензии, что ограничит их возможности по разработке конкурентоспособных моделей ИИ. Парадоксально, но это может привести к снижению инноваций и конкуренции, поскольку только хорошо финансируемые компании, такие как Anthropic, OpenAI или Google, могут привлечь необходимые ресурсы.

С другой стороны, необходимость уплаты лицензионных сборов может привести к повышению эффективности методов обучения. Разработчики ИИ могут больше инвестировать в методы, требующие меньшего количества данных, или использовать синтетические данные, чтобы уменьшить зависимость от лицензированного контента.

Как позиционируют себя правообладатели и представители творческих профессий?

Какие стратегии используют авторы, издатели и другие правообладатели? Организация «Инициатива по защите авторских прав» и подобные ей призывают к более тщательному учету авторских прав при обучении ИИ. Они утверждают, что использование компаниями, занимающимися разработкой ИИ, защищенных авторским правом произведений без согласия или компенсации представляет собой «масштабную кражу интеллектуальной собственности».

Многие правообладатели все чаще используют механизмы отказа от использования ИИ для защиты своих произведений от нежелательного применения. В то же время они изучают способы извлечения прибыли из разработок в области ИИ посредством лицензионных соглашений. Это приводит к сложному сочетанию юридических споров и деловых возможностей.

Судебный иск GEMA против OpenAI показывает, что в этом споре активно участвуют и организации, занимающиеся коллективным управлением авторскими правами. В качестве таких организаций они могли бы представлять интересы своих членов и вести переговоры о лицензировании с компаниями, работающими в сфере искусственного интеллекта.

Каковы долгосрочные перспективы?

Как может развиваться правовая ситуация в ближайшие годы? Дело Anthropic может стать лишь началом волны мировых соглашений и судебных решений, которые переопределят правила обучения ИИ. В США дальнейшие дела могут прояснить доктрину добросовестного использования ИИ, в то время как в Европе практическое применение ограничений TDM продолжает совершенствоваться.

Регламент ЕС об искусственном интеллекте, вероятно, внесет дополнительные уточнения в отношении требований к документации и соблюдения авторских прав. Это может привести к гармонизации практики внутри ЕС, но также и к различиям по сравнению с другими юрисдикциями.

Ключевым фактором станет технологический прогресс: если в будущем модели ИИ можно будет эффективно обучать с меньшим объемом данных или с использованием синтетических данных, это может смягчить проблемы, связанные с авторским правом. Одновременно с этим могут быть разработаны новые методы обнаружения и компенсации за использование контента, защищенного авторским правом.

Дело компании Anthropic знаменует собой важный поворотный момент в развитии индустрии ИИ. Оно демонстрирует, что правовая основа для обучения моделей ИИ еще не до конца ясна, и что как компаниям, занимающимся ИИ, так и правообладателям необходимо найти новые способы согласования своих интересов. Урегулирование спора на сумму 1,5 миллиарда долларов может стать началом новой эры, в которой использование защищенного авторским правом контента для обучения ИИ будет осуществляться на более справедливой и прозрачной основе.

Безопасность данных в ЕС/Германия | Интеграция независимой платформы искусственного интеллекта, объединяющей данные из разных источников, для удовлетворения всех потребностей бизнеса

Независимые платформы искусственного интеллекта как стратегическая альтернатива для европейских компаний - Изображение: Xpert.Digital

Искусственный интеллект меняет правила игры: самая гибкая платформа ИИ — индивидуальные решения, которые снижают затраты, улучшают качество принимаемых решений и повышают эффективность

Независимая платформа искусственного интеллекта: интегрирует все соответствующие источники данных компании

Быстрая интеграция ИИ: индивидуальные решения на основе ИИ для бизнеса, разрабатываемые за считанные часы или дни, а не месяцы
Гибкая инфраструктура: облачные решения или размещение в собственном центре обработки данных (Германия, Европа, свободный выбор местоположения)

Максимальная защита данных: неопровержимое доказательство ее эффективности в юридических фирмах
Развертывание в самых разнообразных корпоративных источниках данных
Выбор собственной или различных моделей ИИ (Германия, ЕС, США, Китай)

Более подробная информация здесь:

Независимые платформы ИИ против крупных провайдеров: какое решение лучше?

Мы здесь для вас — Консультации — Планирование — Внедрение — Управление проектами

☑️ Поддержка малых и средних предприятий в области стратегии, консалтинга, планирования и реализации проектов

☑️ Создание или корректировка стратегии в области ИИ

☑️ Развитие новаторского бизнеса

Konrad Wolfenstein

Я с удовольствием стану вашим личным консультантом.

Вы можете связаться со мной, заполнив форму обратной связи ниже, или просто позвонить мне по номеру +49 7348 4088 965 .

Я с нетерпением жду начала нашего совместного проекта.

Напишите мне

➡️ Запрос на видеозвонок 👩👱

Xpert.Digital - Konrad Wolfenstein

Xpert.Digital — это центр для предприятий, специализирующийся на цифровизации, машиностроении, логистике/внутрипроизводственной логистике и фотовольтаике.

С помощью нашего комплексного решения для развития бизнеса мы поддерживаем известные компании на всех этапах, от привлечения новых клиентов до послепродажного обслуживания.

Анализ рынка, маркетинговый маркетинг, автоматизация маркетинга, разработка контента, PR, почтовые рассылки, персонализированные кампании в социальных сетях и работа с потенциальными клиентами — все это входит в число наших цифровых инструментов.

Более подробную информацию можно найти по ссылкам: www.xpert.digital - www.xpert.solar - www.xpert.plus

Поддерживать связь