代币经济学 | 当人工智能比员工成本更高时:人工智能悄然引发的成本爆炸以及托管式人工智能如何应对
Available in 27 languages 📢
在 Google 上更倾向于选择 Xpert.Digital。ⓘ发布日期:2026年4月28日 / 更新日期:2026年4月28日 – 作者: Konrad Wolfenstein
代币账单爆炸式增长:“托管式人工智能”如何拯救你的IT预算免于破产
### Uber 的人工智能预算超支:代币成本为何超过薪资? ### 人工智能代理的隐性成本:云账单为何突然飙升? ### 一个月人工智能费用高达 11.3 万美元:是警示信号还是未来工作的趋势? ###
企业中隐藏的成本陷阱:基于代币的计费方式如何耗尽企业预算
人工智能曾一度被视为提升生产力的终极利器,但如今却让许多董事会成员忧心忡忡。原因在于:爆炸式增长且难以预测的云服务和代币费用。当像 Uber 这样的公司在短短几个月内就耗尽了年度人工智能预算,而科技巨头们发现,在某些领域,计算能力的成本甚至超过了他们自己的员工,一个关键的转折点已经到来。最初的兴奋过后,残酷的现实摆在眼前:自主人工智能代理和基于使用量的计费模式的隐性成本威胁着企业的盈利能力。但并非没有出路:为了避免落入代币成本陷阱,一种新的战略理念正在兴起——托管式人工智能。了解为什么许多公司的成本核算目前已经失衡,以及您可以运用哪些具体的财务运营策略来控制人工智能支出,避免预算超支。.
统一费率时代的终结:企业如何避免陷入人工智能成本陷阱
科技行业目前正经历着一场期待已久的幻灭:人工智能不再仅仅是许多公司提高生产力的工具,而变成了一项独立且难以计算的成本因素——在极端情况下,其成本甚至超过了人力成本。两年前听起来或许还算大胆的预测,如今却成了2026年残酷的商业现实。问题不再是人工智能是否能创造附加值,而是这种附加值是否足以抵消其爆炸式增长的运营成本。而一种有望提供答案的概念正在兴起:托管式人工智能。.
基础不稳:为什么成本核算不再成立
两年来,科技公司几乎没有质疑过人工智能预算。其逻辑看似简单:先投资者胜,后犹豫者落后。在这种乐观氛围下,数十亿美元涌入语言模型、编码助手和自主代理——往往缺乏严格的性能评估和成本限制。如今,代价已至,这些数字令人难以忽视。.
当人工智能不仅被用作工具,而是成为主要劳动力时,这个问题就显得尤为突出。英伟达应用深度学习副总裁布莱恩·卡坦扎罗 (Bryan Catanzaro) 在接受 Axios 采访时用一句话概括了这一点:他团队的计算成本远远超过了人员成本。这番话分量很重——不仅因为它出自一家本身就处于人工智能基础设施浪潮中心的公司,更因为它描述了一种迄今为止在管理报告中几乎未曾提及的系统性转变。.
原因在于现代人工智能计费模式的结构。像 GPT、Claude 或 Gemini 这样的大型语言模型并非按固定费用收费,而是基于词元(token)——文本在处理过程中被分解成的最小单元。高级模型每百万个输入词元收费 2.50 美元到 5.00 美元,每百万个输出词元收费 10 美元到 25 美元。这听起来很抽象,但很快就会变得具体:任何每天通过生产环境人工智能系统发送数千个查询、运行具有较长上下文窗口的代理程序或执行自动化代码审查的人都会累积巨额费用——而且往往直到收到月度账单才意识到这一点。.
Uber时刻:给整个行业敲响的警钟
最近发生的诸多案例中,没有哪一起比优步(Uber)的案例更能生动地说明这个问题。这家网约车公司的首席技术官普拉文·尼帕利·纳加(Praveen Neppalli Naga)向《信息报》(The Information)坦言,公司2026年的人工智能预算在年初几个月就已经全部用完——这主要是由于Anthropic公司的Claude Code被迅速采用。纳加直言不讳地说:“我不得不重新制定预算,因为我原先预想的预算已经被超支了。” 引发预算超支的并非某个大型项目,而是该工具在整个工程部门的逐步推广。优步向大约5000名开发人员授予了Claude Code的访问权限——而这无疑对预算造成了巨大的影响。.
Naga 还揭示了一个惊人的事实:Uber 代码库中 11% 的实时更新现在是由人工智能代理而非人类编写的。因此,该公司正经历着一场真正的软件开发转型——而为此付出的代价远远超出了最初的预期。悖论显而易见:人工智能越有用,使用量就越大,成本也就越高。基于使用量的定价模式直接将成功转化为成本压力。.
硅谷知名投资人杰森·卡拉卡尼斯 (Jason Calacanis) 也描述过类似的经历:使用 Anthropic 的 Claude API 时,代理每天的成本高达 300 美元,而其工作量却只相当于一名员工的一小部分。他的结论是:代理的成本究竟在什么情况下才会超过其所替代员工的薪水?这个问题——虽然是反问,但从数学角度来看却是现实的——已经成为 2026 年人工智能经济学的核心问题。.
为六位数账单感到自豪:天鹅人工智能现象
另一方面,Swan AI这家四人初创公司的首席执行官Amos Bar-Joseph则截然不同。他在LinkedIn上发布了一张Anthropic公司的发票,单月金额高达113,421.87美元,并写道,他从未对一张发票如此引以为豪。Swan AI是一家专注于自主销售代理的公司,他们将人工智能方面的投入视为人力成本的结构性替代方案:更少的员工,更高的智能——这就是他们的承诺。这位首席执行官明确地将此定义为一种商业模式:目标是实现每位员工每年1000万美元的经常性收入(ARR)。.
Swan AI 已经公布了七位数的经常性收入,而且据其自身声明,最近一周的年度经常性收入 (ARR) 就增长了约 20 万美元,这听起来很有说服力。然而,Bar-Joseph 没有披露的关键信息是:利润率。如果每月 11.3 万美元的 AI 账单相当于每年超过 130 万美元的成本,那么其产生的收入必须远高于此——并且利润率必须足以覆盖基础设施、税收和其他费用。独立消息来源证实:该公司拒绝提供具体的收入数据。因此,被宣传为成功案例的数据很可能只是不完整的账目。.
然而,巴尔-约瑟夫的帖子揭示了一种观念的转变:在科技行业的某些领域,人工智能的支出金额正成为一种身份的象征——就像过去员工人数或办公面积被视为公司规模的指标一样。如果支出和收入没有紧密联系,这种逻辑就蕴含着巨大的风险。.
市场正在爆炸式增长:6.31 万亿美元的 IT 支出是一个警示信号。
宏观层面也反映了个体成本压力。据 Gartner 预测,2026 年全球 IT 支出将达到 6.31 万亿美元,较 2025 年增长 13.5%。数据中心领域的增长尤为显著:服务器系统支出预计将增长 36.9%,数据中心总规模预计将首次突破 6500 亿美元。与此同时,Gartner 还预测,生成式人工智能模型方面的支出将增长 80.8%。.
这些数据并非反映由可衡量的附加值预期驱动的有机投资周期,而是反映一个仍在全速运转的市场,而刹车——换句话说,成本意识——才刚刚开始发挥作用。与 Gartner 的数据相呼应,一项研究表明,到 2026 年,全球人工智能支出将增长 44%,而员工培训和发展预算仅增长 5%。如果企业在技术支出方面的增长速度几乎是员工赋能速度的十倍,则可能面临资源的大规模错配风险。.
Forrester Research 的说法更为直白:过去十二个月中,只有不到 15% 的人工智能决策者表示,人工智能投资带来了可衡量的 EBITDA 增长。甚至不到三分之一的人能够将人工智能支出的价值与损益表中的具体变化联系起来。其结果是:Forrester 预测,企业将把 2026 年计划的人工智能支出的 25% 推迟到 2027 年——这是由首席财务官们日益增长的不安情绪所引发的市场调整。.
代币经济学:日常业务中隐形的成本陷阱
为了理解问题的严重性,有必要仔细审视基于令牌的计费模式的结构。它们对企业来说尤其棘手,原因有二:首先,它们的成本并非与价值呈线性关系,而是与使用量成正比。每一个措辞不当的提示、每一个过长的上下文窗口、每一次因错误导致的重试循环都会产生费用——无论结果是否可用。其次,它们难以与传统的财务运营系统集成,因为后者通常以虚拟机、计算实例或用户许可证为计量单位,而非文本段数。.
一个具体的实践案例:Azure OpenAI 对输入令牌和输出令牌分别收费,输出令牌的价格通常是输入令牌的三到五倍。同时,每次用户请求之前执行的系统提示会消耗大量的输入令牌——而用户在前端界面上却看不到这一点。任何运行数千个代理程序且这些代理程序执行冗长系统提示的用户,即使代理程序当前没有执行任何有用的操作,也会持续为此付费。.
随着固定费率时代的终结,成本结构正变得愈发复杂。Anthropic 已将其企业计费模式从固定费用转向完全基于代币的定价——预计其他供应商也将在六个月内效仿。此前作为安全缓冲的固定费用模式(该模式还能吸收超额使用费用)如今已成为历史。那些仍然沿用旧模式计算人工智能成本的预算经理们,正面临着对其整个人工智能战略进行结构性重新评估的挑战。.
投资者为何要求答案:公司治理危机
在上市公司中,问题升级到了另一个层面:对股东的问责。董事会和首席财务官们现在询问人工智能投资的可衡量附加值的频率和力度,在两年前是难以想象的。根据 Grant Thornton 发布的 2026 年第一季度首席财务官调查,68% 的首席财务官预计将进一步增加其在 IT 和数字化转型方面的支出——这是该调查 21 个季度以来的最高比例。这个数字乍听之下似乎很乐观,但如果考虑到其背后的含义,就会发现并非如此:首席财务官们正在积极参与人工智能决策,而这些决策以前完全由首席信息官或首席技术官负责。.
Asymbl 的 Brad Owens 指出,高管们的意识正在发生深刻转变:核心问题不再仅仅是人工智能的成本,而是员工(无论是人类员工还是数字员工)的真正价值。虽然目前还没有确切的答案,但这个问题被提出的频率却越来越高。这标志着一种范式转变:人工智能不再被视为一项可自由支配的实验,而是被视为一项受监管的业务资产——因此,其可衡量性和合理性也需要得到相应的满足。.
问责危机已在统计数据中得到证实:根据 Larridin 发布的《2025 年企业人工智能现状报告》,72% 的公司正因低效使用人工智能而造成价值损失。这听起来很严重,但考虑到许多公司只衡量人工智能工具的采用情况,而不衡量生产力或业务价值创造的实际变化,这一结果就并非毫无道理。观察到员工正在使用人工智能工具与证明该工具能为公司带来可衡量的盈利提升之间存在着巨大的差异。.
隐藏的成本冰山:代币价格表掩盖了什么
公众讨论主要集中在语言模型的API成本上。但这只是冰山一角。人工智能实际运营成本的绝大部分隐藏在表面之下,并且在许多商业案例中被忽略了。.
根据 Gartner 的数据,超过 75% 的企业级 AI 工作负载运行在云端。这为模型成本增加了基础设施成本,包括计算、存储、网络、CDN 和消息队列。对于每月处理 1 万到 2 万次对话的基于代理的系统,仅基础设施成本就高达每月 200 到 500 欧元——这还不包括 LLM API 的成本。对于交互量达数十万次的大规模部署,这些成本还会成倍增长。.
供应商报价中很少提及的额外成本包括:企业系统集成和编排(1万至6万欧元)、测试和验证(5000至1.5万欧元)、部署基础设施(1万至3万欧元)、持续维护、模型重新训练以及安全补丁(每年1万至5万欧元甚至更多)。Technova Partners 计算得出,从长远来看,实施成本仅占总拥有成本的25%至35%,而65%至75%的成本则发生在持续运营期间。任何认为初始部署之后最大的支出阶段就已过去的人的,都系统性地低估了实际情况。.
在自主人工智能代理领域,这种差距更为显著。Salesforce 的 Agentforce 产品每次对话收费两美元——乍听之下似乎合理。但数据云许可、CRM 先决条件、集成工作以及持续监管等隐性成本,使得实际支出远远超出这个数字。Gartner 预测,到 2027 年底,超过 40% 的人工智能代理项目将会终止——该分析机构指出,成本不断攀升和附加值不明朗是主要原因。.
当自主性成为成本问题时:人工智能代理的价格
完全自主的人工智能代理成本尤其高昂,因为它们无需持续的人工监督即可做出决策并执行操作。与间歇性消耗代币的聊天机器人不同,人工智能代理会持续消耗代币——在规划、监控、纠错和反馈过程中都需要消耗代币。对自主部署场景的分析表明,不受控制的代理每年可能产生 12 万至 27 万美元的计算成本——此外,还有可能比供应商报价高出 200% 至 400% 的隐性基础设施成本。.
人们普遍误以为这些智能体完全自主,因此成本效益高。事实上,即使是最先进的系统也需要人工监督、定期纠正和情境干预。人的因素并没有消失,而是发生了转变。直接执行任务变成了对机器进行监督、校准和质量保证。这项工作虽然不那么显眼,但其真实性丝毫不减。任何将智能体视为人类工人的廉价替代品,却忽略这些监控成本的人,都是在进行会计造假。.
🤖🚀 托管式 AI 平台:借助 UNFRAME,实现更快、更安全、更智能的 AI 解决方案
在这里,您将了解到您的公司如何快速、安全地实施定制化的人工智能解决方案,且无需承担过高的准入门槛。.
托管式人工智能平台是您实现人工智能的全方位、无忧解决方案。您无需处理复杂的技术、昂贵的基础设施和漫长的开发流程,即可从专业合作伙伴处获得根据您的需求量身定制的现成解决方案——通常只需几天时间。.
主要优势一览:
⚡ 快速实施:从构思到可立即使用的应用,只需几天而非几个月。我们提供切实可行的解决方案,创造即时附加值。.
🔒 最高数据安全保障:您的敏感数据始终由您掌控。我们保证安全合规地处理您的数据,绝不与任何第三方共享。.
💸 无财务风险:您只需为结果付费。完全无需前期投入大量资金用于硬件、软件或人员。.
🎯 专注于您的核心业务:集中精力做好您最擅长的事情。我们将负责您人工智能解决方案的全部技术实施、运营和维护。.
📈面向未来且可扩展:您的AI将与您一同成长。我们确保持续优化和可扩展性,并灵活调整模型以适应新的需求。.
更多信息请点击这里:
系统性降低成本:可将代币成本降低高达 40% 的技术
托管式人工智能:旨在控制成本的概念
在此背景下,“托管式人工智能”的概念正日益凸显其战略意义。它指的并非单一技术,而是一种涵盖企业整个人工智能供应链的综合治理模式——从模型选择和快速工程开发,到持续的成本监控和结果评估。托管式人工智能服务由第三方供应商提供,他们全面负责人工智能解决方案的部署、监控和维护,并在成本效益、安全性和合规性方面贡献专业知识。.
毕马威估计,现代托管服务可以通过流程优化、减少技术债务以及提高人工智能和云运营效率,将总运营成本降低 15% 至 45%。这听起来很诱人,但附加值并非自动实现。它需要清晰的治理结构、明确的职责以及深入到代币层面的成本透明文化。.
FinOps框架最初是为云成本管理而开发的,如今正越来越多地应用于人工智能领域。FinOps基金会将稳健的人工智能成本管理的核心要素描述为:清晰的人工智能支出所有权结构、细粒度的追踪(细化到代币或GPU级别)、实施增量融资模式并定期进行“快速失败”审查,以及建立公司范围内的人工智能投资委员会。这些措施并非技术性的,而是组织性的——这也解释了为什么许多公司即使拥有这些工具仍然失败:他们缺乏的是流程和文化,而非工具本身。.
技术杠杆:如何系统地优化代币消耗
在技术层面上,已经存在一套成熟的代币成本优化工具包,但许多公司尚未持续地使用它。.
最有效且首要的措施是提示符优化。过长的系统提示符、多余的上下文信息或冗余指令会消耗输入令牌,却无法提升输出质量。专业的提示符优化可以在保持输出质量的前提下,减少 20% 到 40% 的令牌消耗。结合提示符缓存(一种重用常用提示符组件的机制),可以显著节省资源。.
第二个关键因素是模型路由:认识到并非所有任务都需要功能最强大、成本最高的模型。简单的分类、格式化或摘要任务,使用每百万输入词元成本仅为 0.15 美元到 1.00 美元的经济型模型,与使用成本高出七到三十倍的高级模型,效果同样出色。智能路由系统能够自动将请求分配给最具成本效益的模型,从而大幅降低每次请求的平均成本。.
第三个杠杆:上下文窗口管理。许多代理架构会在每次请求时传递完整的对话历史记录——即使其中只有一小部分与当前任务相关。诸如提前停止、提示截断和选择性上下文采样等技术可以在不牺牲质量的前提下减少输出令牌的数量。德勤洞察强调,一旦令牌生成量达到临界值,与基于 API 的解决方案相比,本地部署的 AI 工厂模型可以在三年内节省 50% 以上的成本。.
第四个杠杆:通过预算保障和异常检测进行治理。在设定的阈值下触发警报、暂停工作负载或重定向到更具成本效益的模式的自动化系统,是防止类似优步式预算超支的最有效保障。这些系统确实存在,只是很少在收到第一张巨额账单之前得到实施。.
人工智能领域的财务运营:治理即战略竞争优势
技术工具箱背后蕴藏着企业管理中更为深刻的转变:人工智能支出必须像一个成熟的成本中心一样进行管理——运用企业用于人事、采购或资本投资的所有工具。这听起来显而易见,但事实并非如此。许多公司迄今为止仍将人工智能支出计入模糊的创新预算中,而这些预算并未受到严格的投资回报率监控。.
Tredence 使用特定的关键绩效指标 (KPI) 来描述人工智能治理结构的成熟度:决策摩擦(减少预算规避和紧急支出)、投资重点(人工智能预算中用于规模化部署的比例与纯粹实验性支出的比例)以及治理信心(每个人工智能项目的清晰所有权结构)。衡量这些指标的公司可以通过直接比较,更清晰地传达其人工智能支出是否具有战略合理性,从而更快地获得财务主管的预算批准。.
高盛基于对约40家公司的访谈,分析了人工智能定价的结构性转变:供应商正从基于用户的计费方式转向基于绩效的计费方式——他们不再出售用户访问权限,而是出售劳动单位。这为企业将人工智能支出与业务成果直接挂钩创造了新的机会,但也使计算变得更加复杂。那些以“劳动单位”购买人工智能的企业需要了解劳动单位的价值。而大多数企业目前尚不具备这种认知。.
新的工作算术:人与机器的较量——但与预期不同
人们常常将人工智能成本与人员成本进行比较,但这种比较过于简单化:用人工智能代替人类可以节省 90% 的成本。这种计算方法在非常特定的条件下成立,但在其他情况下则不成立。对于数据录入、标准客户服务或简单代码生成等重复性、定义明确的任务,实践表明,人工智能系统的实际成本每年在 3,000 美元到 25,000 美元之间,而全职员工岗位的全部成本(包括福利、办公空间和员工流动)则在 75,000 美元到 95,000 美元之间。五年下来,全职员工岗位的总投资为 375,000 美元到 475,000 美元,而同等人工智能系统的成本仅为 15,000 美元到 100,000 美元。.
然而,随着任务变得更加复杂、对上下文更加敏感或更具创造性,这种优势就会减弱。依赖昂贵的高端模型以实现高质量输出,同时又需要大量人工监督的人工智能系统,其成本很快就会超过它们原本要取代的人员。英伟达经理卡坦扎罗所描述的这种现象,正是当高维任务(例如深度学习研究、架构设计决策、战略推理)由人工智能支持,但所需的计算能力过大,以至于成本超过了人员成本时所体现出来的。.
关键变量在于任务结构:任务越标准化、工作量越大,人工智能的成本优势就越明显;任务越具创造性、战略性和情境依赖性,成本计算就越复杂。如果企业将所有人工智能都视为人员替代方案,而不根据任务类型进行区分,就会落入典型的成本陷阱。.
价格悖论:代币价格降低,但总体成本却更高。
人工智能成本问题中最令人惊讶的动态之一是价格悖论,德勤在一份分析报告中将其描述为“价格下跌,消费上升”。代币的单位成本确实在下降:像OpenAI和Anthropic这样的模型提供商在过去两年中多次下调代币价格,有些情况下甚至比发行价降低了80%到90%。与此同时,人工智能的总支出却在急剧上升。.
原因在于消费模式:随着价格下降,使用强度不成比例地增加。一些在价格较高时不具备经济可行性的新应用场景被开发出来。代理数量、用户数量、模型调用次数和上下文时长增长速度超过了价格下降速度。这就是能源经济学中经典的反弹效应:能源价格下降不会导致消费减少,反而会导致消费增加。即使边际单位价格下降,绝对成本基础也会上升。.
对首席财务官而言,这意味着与人工智能提供商的价格谈判并不能从根本上解决问题。代币价格降低20%所带来的收益,会被使用量增加25%所抵消。结构性成本降低只能通过完善治理来实现,而非通过降低购买价格。.
战略展望:管理良好的公司现在有哪些不同之处
到2026年,那些认真对待人工智能成本的公司将会采取一些与平均水平不同的做法。首先,他们不会将人工智能支出视为IT成本项目,而是将其视为一项具有明确投资回报率预期的战略投资。每一项人工智能计划都将由业务部门而非IT部门的负责人发起,并制定明确的商业计划和可衡量的成功标准。.
其次,他们实现了代币可见性:实时仪表盘能够将支出细分到团队、应用程序和用例层面。像 Finout 这样的 FinOps 平台无需修改代码即可在代币层面实现虚拟标记,从而使业务部门能够直接核算其 AI 支出,进而实现成本分摊模型。这种内部透明度通常比外部价格谈判更有效。.
第三,领先企业正在采用模型组合模式:他们不会使用单一的旗舰模型来处理所有任务,而是结合使用多种模型,例如用于标准任务的经济型模型、用于复杂需求的付费模型以及用于数据敏感型用例的专用开源模型。德勤建议,如果可以通过规模较小、精细调整的模型来满足质量要求,则应使用开源模型——这样可以显著节省成本并减少对商业供应商的依赖。.
第四,这些公司实施了增量式融资模式:不再预先分配年度人工智能预算,而是按季度提供资金,并设置强制性审查机制,只有证明其具有可衡量的价值贡献,项目才能继续部署。FinOps 基金会将这一原则称为“快速失败融资”——它鼓励尽早终止表现不佳的人工智能项目,而不是继续投入资金。.
市场寻求均衡
总体而言,人工智能行业仍在探索其在工业规模上的真正价值。模型的技术能力令人瞩目,并且发展迅速。然而,由此产生的成本的经济可控性却相对滞后——这并非因为缺乏工具,而是因为企业在持续实施这些工具方面的组织成熟度仍然不足。.
企业若在缺乏治理的情况下大规模投入人工智能,则可能将原本看似具有的竞争优势转化为难以察觉的利润问题。相反,那些从一开始就投资于代币治理、模型路由、财务运营流程以及清晰的投资回报率衡量标准的企业,能够构建一个即使在人工智能使用量不断增长的情况下也能保持成本效益的基础设施。.
未来几个季度,人工智能资产负债表将成为企业董事会关注的焦点。这并非因为人工智能正在走向失败,而是因为它发展得太快,其成本已超出可控范围。Forrester 预测,到 2026 年底,市场将迎来真正的调整:专注于 GPU 的新型云服务提供商将逐渐从大型超大规模云服务商手中夺取市场份额,并为人工智能工作负载提供更经济实惠的基础设施。这将加剧价格竞争,并赋予企业新的议价能力。.
未来两到三年的关键技能并非人工智能的应用,因为几乎所有公司都在应用人工智能。关键技能在于如何以成本效益比持续为正的方式运用人工智能。各种形式的人工智能管理并非锦上添花,而是应对结构性挑战的根本解决方案。.




















