每本书赔偿3000美元：人工智能公司Anthropic在版权纠纷中向作者支付了15亿美元。

Konrad Wolfenstein

11个月前

每本书赔偿3000美元：人工智能公司Anthropic因版权纠纷向作者支付15亿美元——图片来源：Xpert.Digital

Anthropic 与十亿美元和解：人工智能版权法的范式转变

Anthropic 案对人工智能行业意味着什么？

此案尤其引人注目，因为Claude聊天机器人的提供商Anthropic公司并非因使用受版权保护的书籍训练其人工智能而被起诉，而是因其获取数据的方式而被起诉。美国法院裁定，虽然在某些情况下，使用受版权保护的文本训练人工智能可能符合美国合理使用原则，但从非法来源下载内容则不在此列。关键在于，Anthropic公司显然明知这些数据的非法来源。.

与此相关：

Anthropic 与人工智能 Claude：人工智能巨头的崛起——评估、竞争与伦理愿景

这项历史性协议是如何达成的？

针对Anthropic的具体指控是什么？作者指控该公司未经许可从两个侵犯版权的在线数据库中下载了约50万册书籍和文本。这些数据随后被用于训练人工智能聊天机器人Claude，Claude被认为是OpenAI的ChatGPT的主要竞争对手之一。.

根据和解协议，Anthropic公司将为每部受影响的作品支付约3000美元的赔偿金，约合2500欧元。这一金额是美国版权法规定的最低法定赔偿金的四倍。此外，Anthropic公司必须销毁盗版文件及其所有副本，但保留合法获取和扫描书籍的版权。.

安特罗皮克公司为何同意这项和解协议？该公司希望避免诉讼，因为诉讼可能导致每本书最高15万美元的罚款。由于受影响的作品多达50万册，这意味着潜在的赔偿金额可能高达750亿美元——即使对于一家近期融资130亿美元的公司来说，这也是一笔巨款。.

美国和德国的法律状况有何不同？

随着欧盟版权指令的实施，德国在《版权法》中新增了第44b条，该条款规范了所谓的文本和数据挖掘（TDM）。该条款允许对大型数据集（无论是文本还是图像）进行自动化分析，以提取信息。人工智能的训练通常也属于该条款的管辖范围。.

欧盟《数字单一市场指令》（DSM指令）区分了两种类型的文本和数据挖掘：第3条允许研究机构和文化遗产机构出于科学研究目的进行文本和数据挖掘，前提是它们拥有合法获取作品的途径。此项例外具有强制性，不得通过合同条款排除。另一方面，第4条允许出于任何目的（包括商业目的）进行一般文本和数据挖掘，但存在一项重要的限制，即必须采用选择退出机制。.

法律评估中哪些技术因素起作用？

为什么人工智能训练的技术运作对法律评估如此重要？版权倡议组织（Copyright Initiative）近期一项由蒂姆·W·多尼斯教授和塞巴斯蒂安·斯托伯教授开展的研究，揭示了人工智能训练的“黑箱”机制。研究人员得出结论：从技术角度来看，生成式人工智能模型的训练并非传统的文本和数据挖掘，而是一种侵犯版权的行为。.

训练人工智能模型的技术过程是怎样的？该过程涉及几个与版权相关的步骤：首先，系统地收集数据，这本身就构成版权法意义上的复制行为。然后，将收集到的数据存储在服务器上，并进行训练前的准备工作。最后，人工智能模型分析数据，提取模式、风格和信息。.

一个尤为关键的点是所谓的“记忆”：当前的生成模型能够部分或全部记忆训练数据，因此最终用户在适当提示下可以重新生成这些数据，从而实现复制。这远远超出了传统文本和数据挖掘所关注的简单分析范畴。.

Claude是如何在与ChatGPT的竞争中定位自己的？

版权纠纷对Anthropic的市场地位有何影响？尽管存在法律问题，Claude仍然确立了其作为ChatGPT强劲竞争对手的地位。根据目前的市场分析，Anthropic在企业级大型语言模型市场占据32%的份额，而OpenAI以25%的市场份额位居第二。.

Anthropic 在编程领域地位尤为强大：该公司占据 42% 的市场份额，遥遥领先于其他供应商，是 OpenAI（市场份额为 21%）的两倍多。Claude 之所以能取得如此主导地位，主要归功于其令人印象深刻的 20 万个令牌的上下文窗口，这使得它能够一次性处理完整的业务报告。.

与 ChatGPT 相比，Claude 的具体优势是什么？Claude 因其更“人性化”的沟通方式和对复杂概念的细致理解而备受赞誉。Anthropic 专注于符合伦理的 AI 开发和安全，这使其成为那些特别重视在敏感应用中采取负责任实践的公司值得信赖的供应商。.

Anthropic 采用宪法人工智能 (Constitutional AI) 技术，将伦理准则直接融入模型中。这有助于防止有害或带有偏见的支出，并建立高度的用户信任。虽然 OpenAI 也积极参与人工智能安全领域，但 Anthropic 对开发符合伦理的人工智能模型的明确承诺使其拥有显著优势。.

还有哪些诉讼正在影响人工智能行业？

Anthropic 的案例只是冰山一角吗？事实上，美国目前有超过 40 起针对人工智能技术提供商的版权侵权诉讼正在审理中。例如，OpenAI 就曾被《纽约时报》起诉，而在此次和解之后，Anthropic 还面临着其他诉讼，包括来自音乐出版商和在线平台 Reddit 的诉讼。.

苹果公司最近也成为了版权诉讼的目标：一些作者起诉这家科技公司，指控其非法使用他们的版权书籍来训练人工智能系统。原告指控苹果公司未经许可、未注明出处、也未支付报酬就复制了受保护的作品。.

在德国，GEMA成为全球首个就OpenAI未经授权使用受版权保护的音乐作品提起诉讼的版权集体管理组织。GEMA指控OpenAI未经许可或向作者支付报酬，擅自复制德国作者的受版权保护的歌词。.

选择退出机制的发展情况如何？

然而，选择退出机制的实际应用十分复杂：如何以技术和法律上有效的方式声明此类保留，以及人工智能开发者应如何处理，目前尚未得到明确界定。人们担心，广泛采用选择退出机制可能会显著限制欧洲人工智能模型的训练数据。.

借助“托管人工智能”（人工智能）实现数字化转型的新维度——平台及B2B解决方案 | Xpert咨询

“托管式人工智能”开启数字化转型新篇章——平台及B2B解决方案 | Xpert Consulting - 图片来源：Xpert.Digital

在这里，您将了解到您的公司如何快速、安全地实施定制化的人工智能解决方案，且无需承担过高的准入门槛。.

托管式人工智能平台是您实现人工智能的全方位、无忧解决方案。您无需处理复杂的技术、昂贵的基础设施和漫长的开发流程，即可从专业合作伙伴处获得根据您的需求量身定制的现成解决方案——通常只需几天时间。.

主要优势一览：

⚡ 快速实施：从构思到可立即使用的应用，只需几天而非几个月。我们提供切实可行的解决方案，创造即时附加值。.

🔒 最高数据安全保障：您的敏感数据始终由您掌控。我们保证安全合规地处理您的数据，绝不与任何第三方共享。.

💸 无财务风险：您只需为结果付费。完全无需前期投入大量资金用于硬件、软件或人员。.

🎯 专注于您的核心业务：集中精力做好您最擅长的事情。我们将负责您人工智能解决方案的全部技术实施、运营和维护。.

📈面向未来且可扩展：您的AI将与您一同成长。我们确保持续优化和可扩展性，并灵活调整模型以适应新的需求。.

更多信息请点击这里：

托管式人工智能解决方案——工业人工智能服务：服务业、工业和机械工程领域保持竞争力的关键

人工智能数据授权市场：对出版商来说是机遇还是对初创企业的风险？

欧盟人工智能监管发挥着怎样的作用？

新的欧盟人工智能法规如何影响版权？虽然该法规没有包含任何关于版权例外情况的新规定，但它明确指出，除非存在限制，否则使用受版权保护的内容需要获得权利持有人的许可。.

所有通用人工智能模型提供商都必须遵守全面的文档要求。这包括对用于训练的数据进行详细描述，例如数据类型、来源和处理方法。尤其重要的是，他们必须确保识别并遵守《数字单一市场指令》下的法律保留条款。.

人工智能办公室负责监督这些规定的遵守情况，但并不逐一审查版权侵权行为。人工智能法规援引《数字单一市场指令》，明确立法者假定文本和数据挖掘例外条款适用于生成式人工智能模型的训练。.

与此相关：

克劳德·戈夫：人工智能发展为美国国家安全带来激动人心的成果

科学用途和商业用途有何不同？

科学研究适用哪些特殊规定？汉堡地方法院在一项具有里程碑意义的裁决中认定，研究机构在特定条件下可以使用受版权保护的作品来训练人工智能。该案涉及一家研究机构使用受版权保护的图像，该机构创建了一个大型图像-文本数据集，用于训练生成式人工智能模型。.

法院裁定，创建人工智能训练数据集的行为属于科研自由的范畴，即使商业公司之后会使用以此方式获得的数据。关键在于，数据集的初始创建目的必须是为了获取知识。在此背景下，科学研究的概念被赋予了广义的解释。.

国际间存在哪些差异？

其他国家如何处理人工智能版权问题？日本被认为对创新特别友好，并已于2018年修订了其版权法。日本《著作权法》第30条之4引入了一项灵活的例外条款，允许不以“欣赏”作品为目的的使用。这通常被解释为，只要目标是数据分析而非作品本身的消费，那么训练人工智能模型也可以包含在例外范围内。.

自脱欧以来，英国一直走着自己的道路。英国政府曾就人工智能开发者（尤其是时间数据管理开发者）的版权豁免问题进行磋商。然而，这些提议遭到了创意产业的强烈反对，导致未来走向不明朗。.

中国于2020年修订了著作权法，总体上加强了知识产权保护。针对人工智能训练的具体法规仍在制定中，但中国认识到人工智能的战略重要性，预计会寻求务实的解决方案。.

这个案例对其他人工智能公司意味着什么？

其他人工智能公司能从Anthropic的案例中吸取哪些教训？对比表明，训练数据的来源至关重要。虽然使用合法获取的数据进行训练可能受到合理使用或时间数据管理（TDM）限制的保护，但使用非法获取的数据则可能导致巨额罚款。.

对于人工智能模型和人工智能系统的提供商而言，使用可信赖的供应商生成训练数据至关重要，因为这些供应商在创建数据时会尊重他人的知识产权。即使不知情，也可能面临法律后果。.

人工智能训练数据市场将如何发展？

与此同时，人工智能公司还面临着获取高质量且符合法律规定的训练数据的挑战。此类许可的费用可能相当高昂，尤其是对于缺乏 Anthropologie 或 OpenAI 等公司资源的小型公司而言。.

由此催生了专门创建和授权符合法律规定的训练数据集的专业数据提供商，这是该趋势的必然结果。这些提供商可以作为权利持有者和人工智能开发者之间的中介，确保所有法律要求都得到满足。.

这将对创新和竞争产生什么影响？

规模较小的公司和初创企业可能无力承担必要的许可费用，这将限制它们开发具有竞争力的AI模型的能力。矛盾的是，这可能会导致创新和竞争减少，因为只有像Anthropic、OpenAI或谷歌这样资金雄厚的公司才能筹集到必要的资源。.

另一方面，支付许可费的需求可能会促使人们采用更高效的训练方法。人工智能开发者可能会加大对数据需求量更少的技术或使用合成数据的技术的投入，以减少对许可内容的依赖。.

版权所有者和创意专业人士如何定位自己？

GEMA对OpenAI提起的诉讼表明，集体管理组织也在这场纠纷中扮演着积极的角色。作为集体组织，它们可以代表其成员的利益，并与人工智能公司进行许可谈判。.

长期前景如何？

未来几年，法律格局将如何发展？Anthropic案或许只是众多和解协议和法院判决的开端，这些协议和判决将重新定义人工智能训练的规则。在美国，更多案例可能会进一步阐明人工智能领域的合理使用原则；而在欧洲，时间数据管理（TDM）限制的实际应用仍在不断完善。.

欧盟人工智能法规可能会进一步明确文件要求和版权合规性。这可能有助于欧盟内部实践的统一，但也可能导致与其他司法管辖区之间的差异。.

技术发展将是关键因素：如果未来能够利用更少的数据或合成数据有效地训练人工智能模型，这将有助于缓解版权问题。同时，也可以开发出检测和补偿侵权内容使用的新技术。.

欧盟/德国数据安全 | 集成独立且跨数据源的人工智能平台，满足所有业务需求

独立人工智能平台：欧洲企业的战略选择——图片来源：Xpert.Digital

AI颠覆者：最灵活的AI平台——量身定制的解决方案，降低成本、优化决策、提升效率

独立人工智能平台：整合所有相关的公司数据源

快速集成人工智能：在数小时或数天内为企业量身定制人工智能解决方案，而不是数月。
灵活的基础设施：基于云或托管在您自己的数据中心（德国、欧洲，地点可自由选择）

最高级别的数据安全保障：律师事务所的使用就是无可辩驳的证明。
可部署于各种企业数据源
选择使用我们自己的或不同的AI模型（DE、EU、USA、CN）

更多信息请点击这里：

独立人工智能平台 vs. 超大规模数据中心：哪种解决方案更合适？

我们为您提供以下服务：咨询、规划、实施、项目管理

☑️ 为中小企业提供战略、咨询、规划和实施方面的支持

☑️ 人工智能战略的制定或调整

☑️ 先锋业务发展

Konrad Wolfenstein

我很乐意担任您的私人顾问。.

您可以通过填写下面的联系表格与我联系，或者直接拨打 +49 7348 4088 965 。

我期待着我们的合作项目。.

请给我写信

➡️ 视频通话请求 👩👱

Xpert.Digital - Konrad Wolfenstein

Xpert.Digital 是一个专注于数字化、机械工程、物流/内部物流和光伏领域的行业中心。.

凭借我们的 360° 业务发展解决方案，我们为知名企业提供从新业务拓展到售后服务的全方位支持。.

市场情报、社交媒体营销、营销自动化、内容开发、公关、邮件营销活动、个性化社交媒体和潜在客户培养是我们数字工具的一部分。.

您可以在以下网站找到更多信息： www.xpert.digital - www.xpert.solar - www.xpert.plus

保持联系