微软和优步紧急刹车:人工智能固定费率模式的秘密终结
预算在4个月内耗尽:人工智能代理如何加速支出
人工智能的冰山一角:这些巨大的成本被主要供应商隐瞒了。
人工智能已融入企业的日常生产流程,但随之而来的是前所未有的、往往难以预测的成本飙升。虽然最初的试点阶段还能享受到补贴的固定费率和可控的测试运行,但目前向独立运行、具有智能体的AI系统的过渡,暴露了传统计费模式的致命缺陷:按消耗的代币付费模式正成为预算的定时炸弹。.
即使是像微软或优步这样的科技巨头,在大幅削减人工智能预算或仅几个月就用完额度时,一个问题就显而易见:现行的定价模式将所有经济风险从提供商转移到了买方。本文将探讨基于消费的人工智能计费模式的五大结构性风险,揭示其背后巨大的隐性基础设施成本,并阐明为何范式转变势在必行。对于首席财务官和IT决策者而言,当务之急是:摒弃单纯的资源付费模式,转而采用以结果为导向、奖励真正可衡量的商业价值的合同模式。.
与此相关:
人工智能计费模式的巨大失败——为什么代币定价模型正在让公司蒙受财务损失
谁来为别人的实验买单?
人工智能订阅补贴的时代已经结束。随之而来的是一场令人清醒的清算:微软内部取消了数千份 Claude Code 授权,因为每位开发者的月费高达 500 至 2000 美元。优步在短短四个月内就耗尽了其 2026 年的全部人工智能预算,此前约有 5000 名开发者大量使用了 Claude Code。微软旗下的 GitHub 于 2026 年 6 月 1 日终止了所有 Copilot 订阅,并转而采用名为 GitHub AI Credits 的基于代币的积分系统。这三件事并非技术上的失败,而是幻象的破灭。.
全球企业正面临结构性重新评估:人工智能行业过去一直以试点项目和有限的用例为基础来定价。随着人工智能系统向能够独立规划、迭代和执行的智能体系统转型,代币消耗呈爆炸式增长,传统企业预算根本无法应对。据 Gartner 预测,到 2026 年,全球人工智能支出将达到 2.59 万亿美元,同比增长 47%。现在的问题不再是企业是否会投资人工智能,而是如果投资回报不成正比,谁来承担后果?.
消费计费的错觉
基于代币的计费模式乍听之下似乎很公平:只需为实际使用的资源付费。然而,这种逻辑掩盖了一个根本性的结构性不对称。传统的企业预算基于可预测的投入:用户席位、服务器容量、交易量。而基于代币的计费模式则不然,它并非随着用户数量的增长而扩展,而是随着每次交互的深度和复杂性而扩展。一个用户提出一个简单的问题会消耗几十个代币,而同一个用户分析一份长达50页的合同文件则会消耗数万个代币。.
真正的问题在于非线性。试点阶段通常会招募热情高涨的早期用户,他们以结构化、优化的方式使用人工智能工具。然而,在生产阶段,员工会凭直觉使用这些系统——这会导致冗长的对话、大量的文档上传、反复迭代以及复杂的多阶段推理链。经验观察表明,试点阶段到生产运营阶段的资源消耗通常是前者的三到五倍,极端情况下甚至高达十倍。因此,董事会成员和首席财务官最初用于批准人工智能投资的成本预测在本质上毫无价值。.
供应商向买方转嫁的五类风险
代币定价模型系统性地将五类风险从代币提供方转移到了购买方。这既非巧合,也非市场失灵——而是该商业模式本身的特性。.
预算风险最初源于根本性的合同问题:公司承诺的年度预算基于单位成本,而供应商可以随时调整该成本。Uber 的案例完美地诠释了这一点。Uber 根据扩展前阶段的成本模型计算了其 2026 年全年的 AI 预算。然而,当 Claude Code 的使用率从 32% 的开发人员增长到 84% 时,仅仅四个月后,预算就已耗尽。.
接受风险遵循一种奇特的逻辑:无论已实现的流程是否真正创造价值,代币计数器都会运行。一个模型如果用 10 万个代币给出错误答案,其成本与一个用 10 万个代币给出正确答案的模型相同。根据麻省理工学院的数据,在当今世界,95% 的企业级 GenAI 试点项目都未能实现可衡量的投资回报,因此,这种计费模式对质量的漠视并非无关紧要的问题,而是问题的核心所在。.
在考虑基于代理的人工智能系统的动态特性时,风险预测变得尤为重要。习惯于固定技术费用的首席财务官们如今发现,支出波动性大且难以预测。基于代理的人工智能查询成本是标准LLM调用的5到25倍,因为代理之间的通信、评估器、合成器和重试循环都会成倍增加代币消耗。一个编程代理每天可能消耗700万个代币,而一个数据录入代理每天可能消耗高达2500万个代币。高盛量化了这种变化:到2030年,人工智能代理可能会使全球代币需求增长24倍。.
对于受监管行业而言,治理风险尤为严峻。基于代币的模型会在每次 API 调用时将公司数据路由至第三方提供商的推理基础设施。对于金融服务提供商、医疗保健公司和保险公司而言,这意味着审计风险和合规工作量会随着使用量的增加而增加。GDPR 要求公司对每个处理个人数据的 AI 系统进行数据保护影响评估。每次新的代币消耗都可能影响公司的数据保护边界。代币消耗越多,流出公司的数据就越多——而且往往缺乏透明度。.
结果风险是讨论最少,但却是结构上最重要的类别。代币定价模型衡量的是消耗量,而非价值。无论人工智能项目是否产生可衡量的损益影响,或者最终沦为众多失败的企业级生成式人工智能试点项目之一,提供商获得的报酬都相同。兰德公司的数据显示,80.3% 的人工智能项目未能实现其预期的商业价值。42% 的公司在 2025 年停止了大部分人工智能项目,比上一年增加了 17%。Gartner 估计,到 2026 年,65% 的部署生成式人工智能的公司将超出其预算预期。考虑到所有这些因素以及基于代币的计费模式,显而易见:基于消耗量的计费本质上是在以公司利益为代价进行赌博。.
隐藏的冰山:除了代币价格之外,还有哪些费用需要支付?
可见的账单通常只是实际成本的一小部分。2026 年的跨行业数据显示,在生产环境中实际运行人工智能代理所需的基础设施(包括治理、监控、合规和集成)成本是推理成本本身的 2 到 5 倍。开发一个定义清晰的工作流代理需要 4 万到 7 万美元,每月持续运营成本为 3200 到 1.3 万美元——其中大部分成本并未实现代币化。.
仅可观测性和监控一项,每个智能体每年的成本就高达 6,000 至 50,000 美元。据预测,到 2026 年,全球企业级人工智能智能体支出将达到 2019 亿美元,但智能体产品本身的市场规模估计仅为 90 亿至 110 亿美元。每 1 美元的智能体产品收入背后,大约有 23 美元用于基础设施、集成、咨询和内部开发,而这些成本并未出现在任何供应商的资产负债表上。首席财务官们在报告人工智能支出不断增长时,经常会描述这种现象:人们关注的是名义上的账单,而账单下方的实际成本甚至没有被归类为人工智能支出。.
另一个结构性因素是所谓的代理蔓延。每个新代理都会在代币消耗表中增加一行——而且没有收益保证。由于代币定价模型无法激励系统高效或策略性地使用代理,因此代理会在内部不断扩散。其结果是并行且不受控制的AI工作负载相互通信,从而导致代币数量倍增。.
🤖🚀 托管式 AI 平台:借助 UNFRAME,实现更快、更安全、更智能的 AI 解决方案
在这里,您将了解到您的公司如何快速、安全地实施定制化的人工智能解决方案,且无需承担过高的准入门槛。.
托管式人工智能平台是您实现人工智能的全方位、无忧解决方案。您无需处理复杂的技术、昂贵的基础设施和漫长的开发流程,即可从专业合作伙伴处获得根据您的需求量身定制的现成解决方案——通常只需几天时间。.
主要优势一览:
⚡ 快速实施:从构思到可立即使用的应用,只需几天而非几个月。我们提供切实可行的解决方案,创造即时附加值。.
🔒 最高数据安全保障:您的敏感数据始终由您掌控。我们保证安全合规地处理您的数据,绝不与任何第三方共享。.
💸 无财务风险:您只需为结果付费。完全无需前期投入大量资金用于硬件、软件或人员。.
🎯 专注于您的核心业务:集中精力做好您最擅长的事情。我们将负责您人工智能解决方案的全部技术实施、运营和维护。.
📈面向未来且可扩展:您的AI将与您一同成长。我们确保持续优化和可扩展性,并灵活调整模型以适应新的需求。.
更多信息请点击这里:
以结果而非代币作为衡量标准:这才是人工智能合约应有的样子
为什么现有的软件世界早已克服了这种模式
将当前的AI定价之争置于软件行业发展历程的背景下进行审视,颇具启发意义。过去几十年间,企业软件模式不断演变,从纯粹的按需付费模式逐渐转向系统和服务级别协议(SLA)模式,在后者中,供应商承担了全部成本。ERP系统、CRM平台、云基础设施——这些供应商的软件并非按计算时间消耗收费,而是与可用性、容量和既定的服务级别挂钩。.
人工智能供应商打破了这种做法,因为他们自身的成本结构也基于同样的代币计量,并将这些成本转嫁给客户。大多数人工智能供应商都从相同的基础模型提供商(例如 OpenAI、Anthropic 和 Mistral)购买模型,并将可变成本转嫁给客户。与其他任何软件层不同的是,人工智能的边际成本并非为零。每增加一个用户、每增加一个请求、每增加一个模型版本,供应商的成本都会增加。这种困境确实存在,但这并不能免除供应商自行解决问题的责任,他们应该系统性地将风险转嫁给企业客户。.
与经典的SaaS之争的相似之处颇具启发性。当SaaS取代本地部署软件时,按用户数计费模式成为标准:一个用户,一个价格。人工智能颠覆了这种模式,因为根据任务的不同,单个用户消耗的资源可能是原来的十倍到十万倍。解决方案不能是将这种风险完全转移给买方。解决方案必须是一种商业结构,在这种结构中,提供商的激励机制和买方的收益再次趋于一致。.
结果导向定价作为一种替代合同模式
面向结果的人工智能定价模式并非折扣体系或营销承诺,而是一种截然不同的商业结构:服务提供商按解决方案、按年付费,费用取决于在既定工作流程中确认了明确的业务成果,而非按过程中消耗的代币数量付费。.
这种方法正变得越来越重要。早在2024年底,安德森·霍洛维茨基金就指出,人工智能正在给软件市场带来三大关键转变:软件正在向劳动力转化,席位许可作为计价单位的合法性正在下降,可变成本也变得越来越难以预测。像Decagon这样的人工智能原生公司已经通过结合基于消费和基于结果的混合模式做出了回应。结构性趋势显而易见:随着人工智能取代可衡量的活动——例如客户服务工单、代码行数和文档审核——自然的计价单位将是结果,而不是资源投入。.
基于结果的定价模式与代币模式在结构上的区别在于风险分配。在代币模式下,买方承担全部失败风险——无论结果如何,提供商都能获得收益。而在基于结果的定价模式下,提供商必须建立起足以吸收波动的平台效率——如果服务未能达到预期效果,他们将面临损失收益的风险。这直接激励了提供商追求质量,而代币模式本身缺乏这种激励机制。然而,这也要求提供商能够有效控制内部成本,从而在经济上维持这种模式——而目前大多数代币提供商都无法满足这一要求。.
结果导向型模型的批评者认为,这种模型会将效率提升的收益导向服务提供商:如果人工智能服务提供商通过改进模型以更少的资源实现相同的结果,那么利润增长的受益者并非公司,而是服务提供商本身。这种批评不无道理,也表明结果导向型模型并非必然公平——结果的具体定义、衡量方法和定价机制决定了公司实际获得的收益。.
下一次谈判:每位首席财务官和首席信息官都应该提出哪些要求
至少在每次合约续约谈判中,买方都拥有议价能力。目前持有代币合约的公司必须在下一轮续约谈判中提出结构化的问题,这些问题远不止是每百万代币的价格那么简单。.
核心问题是:如果项目失败,我该付出什么代价?任何不愿分担风险的供应商,其利益结构都与买方的董事会和首席财务官截然不同。这并非出于善意,而是激励机制的问题。第二个关键问题涉及数据主权:每次调用API,我的公司数据是否都会离开我的网络边界?对于金融服务、医疗保健和保险等受监管行业而言,这并非可有可无的合规考量,而是GDPR、SOC 2和HIPAA等法规的基本法律原则。.
第三个关键要求是可衡量性。49% 的公司表示,由于支出分散在云服务提供商、GPU 服务商、API 提供商和 SaaS 平台,且缺乏标准化的计费方式,因此无法可靠地计算其人工智能投资回报率 (ROI)。缺乏衡量标准,公司就无法协商结果模型,也无法就哪些工作流程能够真正产生正向投资回报率做出明智的决策。因此,组织衡量人工智能成本的能力是任何结构化价格谈判的先决条件。.
Gartner 还预测,超过 40% 的智能体 AI 项目会在达到生产就绪状态之前被放弃——这主要是由于智能体扩展的实际成本和复杂性造成的。如今,那些在没有健全的投资回报率 (ROI) 框架的情况下就签订智能体工作流程代币合约的公司,很可能成为那 40% 的失败案例,它们在昂贵的试验后便停止了。.
结构性变革不可避免,但其速度取决于买方。
人工智能产业正面临着不可避免的商业成熟阶段。从补贴阶段到可持续定价模式的转变,必然会经历目前正在显现的危机。微软是全球最大的人工智能基础设施投资者之一,曾向OpenAI投资130亿美元。然而,微软在评估了竞争对手的编码工具价格后,决定拒绝支付。这不仅对特定产品,而且对整个定价模式都发出了一个强有力的象征性信号。.
软件行业的整合逻辑表明,以结果为导向的模式将在中长期内占据主导地位,因为只有这种模式才能始终如一地将供应商的激励机制与业务成果挂钩。现代企业软件的其他各个层面都已经历了这种发展,人工智能也不例外。唯一的问题是,这一成熟过程将由市场机制驱动,还是由一代又一代的商业领袖驱动?这些商业领袖在每次续签合同时都会问一个简单的问题:如果结果没有实现,我付的钱到底有什么意义?
企业在人工智能合同谈判中做出的决定,将决定人工智能投资能否带来可衡量的成果,还是会继续资助那些成功将风险外包的供应商的产品开发路线图。这种区别并非技术性的,而是商业性的。而这一切都将从下一份合同的签署开始。.
🎯🎯🎯 数据驱动的 B2B 行业中心,作为一种准内部解决方案
Xpert.Digital 是一个以数据驱动的 B2B 行业中心,由 Konrad Wolfenstein 领导。该公司为工业合作伙伴提供外部的、准内部解决方案,弥补其在市场营销、内容和销售方面的运营缺口,而无需客户投入额外资源。.
更多信息请点击这里:
您的全球营销和业务拓展合作伙伴
☑️ 我们的业务语言是英语或德语。
☑️ 新增:用您的母语进行通信!
我和我的团队很乐意为您提供私人顾问服务。.
您可以通过填写此处的联系表格联系我wolfenstein@xpert.digital:,或者直接致电+49 7348 4088 965。我的邮箱地址是
我期待着我们的合作项目。.


