死胡同而非超级智能:Meta 的首席远见家为何选择离职
6000亿美元投入到一种错误的做法中?“人工智能教父”看空LLaMA、ChatGPT等公司。
2025年11月,一则消息犹如晴天霹雳般席卷了科技行业。深度学习的三位创始人之一、Meta首席科学家Yann LeCun宣布,在效力该公司十二年后,他将离开公司,创立自己的创业公司。这一决定远非一位科学家的个人职业选择,它标志着全球人工智能产业的一个根本性转折点,也揭示了短期市场利益与长期科学愿景之间日益扩大的鸿沟。
勒昆与杰弗里·辛顿和约书亚·本吉奥共同荣获2018年图灵奖,他被誉为卷积神经网络的奠基人,如今卷积神经网络已成为现代图像处理系统的基础。在他离开之际,整个行业正斥资数千亿美元研发大型语言模型,而勒昆多年来一直认为这项技术是一条死路。现年65岁的勒昆计划通过他的新公司,探索他所谓的“高级机器智能”,这是一种截然不同的方法,它基于世界模型,并从物理感知而非文本出发。
这一发展带来的经济影响是巨大的。Meta公司在过去三年中已在人工智能基础设施方面投资超过6000亿美元。OpenAI的估值已达5000亿美元,而其年收入仅为100亿美元。整个行业的发展方向,被其最重要的先驱之一公开描述为一条死路。要理解这一转变的经济后果,就必须深入研究当前人工智能革命的技术、组织和财务结构。
适合:
泡沫的结构
谷歌研究人员于 2017 年推出的 Transformer 架构以前所未有的速度改变了人工智能的格局。这种方法首次实现了高效处理海量文本,并训练出以前无法企及的语言模型。OpenAI 在此基础上开发了 GPT 系列,并于 2022 年 11 月推出了 ChatGPT,首次向大众展示了这些技术的潜力。反响极其热烈。短短几个月内,数百亿美元的资金涌入该领域。
然而,自2024年底以来,越来越多的迹象表明,这种指数级增长已接近极限。OpenAI公司已投入超过18个月的时间开发GPT-4的继任者,内部代号为Orion或GPT-5。据报道,该公司至少进行了两次大规模训练,每次耗资约5亿美元。结果令人担忧。尽管GPT-4相比GPT-3实现了巨大的性能飞跃,但Orion相对于GPT-4的改进却微乎其微。在某些领域,尤其是在编程方面,该模型几乎没有任何进步。
这一发展从根本上违背了规模效应定律,这些经验原则直到最近还指导着整个行业的发展。其基本理念很简单:如果模型规模更大,训练数据更多,计算能力投入更多,性能提升就会遵循可预测的幂函数。这一原则似乎普遍适用,并为近年来天文数字般的投资提供了依据。然而现在看来,这些曲线正在趋于平缓。投资翻倍不再能带来预期的性能翻倍。
造成这种情况的原因有很多,而且技术上也很复杂。一个关键问题是数据墙。GPT-4 使用了大约 13 万亿个词元进行训练,这几乎相当于整个公开互联网的数据量。而对于 GPT-5 来说,高质量的新数据根本不够用。OpenAI 的应对措施是聘请软件开发人员、数学家和理论物理学家,通过编写代码和解决数学问题来生成新数据。然而,即使 1000 人每天生成 5000 个单词,也需要数月时间才能生成 10 亿个词元。使用人工生成的数据进行扩展根本行不通。
作为一种替代方案,企业越来越依赖合成数据——即由其他人工智能模型生成的数据。但这其中潜藏着一个新的风险:模型崩溃。当模型递归地使用其他模型生成的数据进行训练时,微小的误差会在代际间不断放大。最终导致模型与现实越来越脱节,数据中的少数群体不成比例地消失。2024年发表在《自然》杂志上的一项研究表明,这一过程发生得异常迅速。因此,合成数据并非万能灵药,而是蕴含着巨大的风险。
能源转型与增长的极限
除了数据壁垒之外,还有第二个更为根本的壁垒:能源壁垒。训练 GPT-3 大约消耗了 1300 兆瓦时的电力,相当于 130 个美国家庭一年的用电量。GPT-4 的耗电量估计是其 50 倍,即 65000 兆瓦时。训练大型人工智能模型所需的计算能力大约每 100 天就会翻一番。这种指数级增长很快就会导致物理极限。
用于训练和运行这些模型的数据中心目前的耗电量已经相当于一些小型城镇的用电量。国际能源署预测,到2026年,数据中心的耗电量将增长80%,从2022年的20太瓦时增至2026年的36太瓦时。人工智能是这一增长的主要驱动力。相比之下,一次ChatGPT查询的耗电量大约是谷歌搜索的十倍。每天数十亿次的查询累积起来,耗电量将非常惊人。
这一发展趋势正迫使科技公司采取激进措施。微软已经与核能供应商签署了合同。Meta、亚马逊和谷歌将在未来几年内合计投资超过1.3万亿美元,用于建设必要的基础设施。但这些投资正面临着来自物理和政治方面的双重限制。美国目前的能源基础设施不足以支撑计划中的人工智能数据中心。分析人士估计,到2030年,价值7500亿美元的项目可能会因能源基础设施瓶颈而延期。
此外,地缘政治因素也不容忽视。人工智能产业对能源的需求加剧了资源竞争,并增加了对化石燃料的依赖。尽管政策制定者呼吁实现气候中和,但人工智能产业却在推高能源消耗。这种紧张局势在未来几年将进一步恶化,并可能导致监管干预,从而限制该产业的发展。
建筑墙和勒昆的替代方案
第三个障碍或许是最根本的:架构上的壁垒。多年来,Yann LeCun 一直认为 Transformer 架构存在固有的局限性,无法仅通过扩展来克服。他的批评主要集中在大型语言模型的根本工作原理上。这些系统经过训练,能够预测序列中的下一个词。它们学习海量文本语料库中的统计模式,但却无法真正理解因果关系、物理定律或长期规划。
勒昆喜欢用一个对比来说明这个问题:一个四岁的孩子通过视觉感知吸收的世界信息量,比最优秀的语言模型通过文本吸收的信息量还要多。孩子凭直觉就能理解物体不会凭空消失,重物会掉落,以及行为会产生后果。他们已经发展出一个世界模型,一种对物理现实的内在表征,并用它来进行预测和计划行动。语言模型缺乏这种基本能力。他们能够写出令人印象深刻、条理清晰的文本,但他们并不理解这个世界。
这种局限性在实际应用中反复显现。如果你让 GPT-4 可视化一个旋转的立方体,它连一个孩子都能轻松完成的任务都做不到。对于需要多步骤规划的复杂任务,这些模型经常失败。它们无法可靠地从错误中学习,因为每个预测误差都可能级联并放大自身。自回归模型存在一个根本性的脆弱性:序列早期的一个错误就可能毁掉整个结果。
勒昆提出的替代方案是基于联合嵌入预测架构的世界模型。其基本思想是,人工智能系统不应通过文本预测进行学习,而应通过预测未来状态的抽象表示来进行学习。系统不再逐像素或逐词生成数据,而是学习一个压缩的、结构化的世界表示,并利用该表示在行动前进行不同场景的心理模拟。
在LeCun的领导下,Meta已经开发出多种基于此方法的实现方案。用于图像的I-JEPA和用于视频的V-JEPA均展现出良好的效果。这些模型无需大量数据采集即可学习高层物体组件及其空间关系。与传统模型相比,它们的训练能耗也显著降低。Meta的愿景是将这些方法融合到分层系统中,使其能够在不同的抽象层次和时间尺度上运行。
关键区别在于学习过程的本质。逻辑学习模型(LLM)本质上是在进行模式匹配,而世界模型则旨在把握现实的结构和因果关系。拥有稳健世界模型的系统无需实际执行行动即可预测其行为的后果。它能够从少量示例中学习,因为它理解的是潜在的原理,而不仅仅是表面的关联。
组织功能失调与Meta的生存危机
然而,勒昆的离职并非仅仅是出于科学考量,也是Meta公司组织架构失灵的结果。2025年6月,首席执行官马克·扎克伯格宣布对人工智能部门进行大规模重组。他成立了Meta超级智能实验室,一个旨在开发通用人工智能的新部门。该部门由亚历山大·王领导,他曾是数据准备公司Scale AI的首席执行官,年仅28岁。Meta向Scale AI投资了143亿美元,并从竞争对手那里挖走了50多名工程师和研究人员。
这一决定彻底颠覆了原有的组织架构。LeCun 的基础人工智能研究团队(FAIR)被边缘化,该团队曾花费数年时间开发 PyTorch 和首批 Llama 模型。FAIR 团队专注于未来五到十年的基础研究,而新成立的超级智能实验室则专注于短期产品开发。有消息称,Meta 公司的人工智能部门内部混乱程度日益加剧。新聘的顶尖人才对大型企业的官僚作风感到不满,而老团队的影响力则日渐式微。
短短六个月内,公司经历了多次重组,情况进一步恶化。2025年8月,超级智能实验室再次重组,这次被拆分为四个子部门:一个神秘的待定实验室(用于研发新模型)、一个产品团队、一个基础设施团队以及FAIR部门。同年10月,公司又进行了一轮裁员,约600名员工领取了遣散费。官方给出的理由是:降低组织复杂性,加速人工智能开发。
这些频繁的重组与OpenAI、谷歌和Anthropic等竞争对手的相对稳定形成了鲜明对比。这表明Meta在正确的战略方向上存在根本性的不确定性。扎克伯格已经意识到Meta在人工智能主导地位的竞争中正在落后。2025年4月发布的Llama 4令人失望。虽然Maverick模型展现出了良好的效率,但在更长时间的测试环境中却表现糟糕。有指控称,Meta通过专门针对常见测试题训练模型来优化基准测试,人为地提高了性能。
对乐存而言,这种情况已难以为继。他坚持的长期基础研究理念与追求短期产品成功的压力产生了冲突。他实际上隶属于比他年轻得多的王,这很可能也是促使他做出这一决定的原因之一。在告别信中,乐存强调Meta仍将是他新公司的合伙人,但其传递的信息很明确:他认为至关重要的独立研究在现有的公司架构下已无法进行。
通过“托管人工智能”(人工智能)开启数字化转型的新维度 - 平台和 B2B 解决方案 | Xpert Consulting
在这里您将了解您的公司如何快速、安全且无高门槛地实施定制化的AI解决方案。
托管 AI 平台是您全方位、无忧的人工智能解决方案。您无需处理复杂的技术、昂贵的基础设施和冗长的开发流程,只需几天时间,即可从专业合作伙伴处获得根据您的需求量身定制的交钥匙解决方案。
主要优势一览:
⚡ 快速实施:从构思到实际应用,只需几天,无需数月。我们提供切实可行的解决方案,创造即时价值。
🔒 最高数据安全性:您的敏感数据将由您自行保管。我们保证数据处理安全合规,不会与第三方共享。
💸 无财务风险:您只需为结果付费。完全无需在硬件、软件或人员方面进行高额的前期投资。
🎯 专注于您的核心业务:专注于您最擅长的领域。我们负责您 AI 解决方案的整个技术实施、运营和维护。
📈 面向未来且可扩展:您的 AI 将与您共同成长。我们确保持续优化和可扩展性,并灵活地调整模型以适应新的需求。
更多相关信息请点击这里:
从炒作到现实:人工智能行业即将迎来重新评估
水疱形成的经济学分析
Meta的发展反映了人工智能行业更广泛的经济动态。自ChatGPT在2022年底取得突破性进展以来,前所未有的投资热潮席卷而来。仅在2025年第一季度,就有731亿美元流入人工智能初创企业,占所有风险投资的58%。OpenAI的估值达到了5000亿美元,成为首家估值突破这一门槛但从未盈利的私营公司。
这些公司的估值与其实际收入严重不成比例。OpenAI 预计 2025 年的年收入将达到 100 亿美元,估值却高达 5000 亿美元,市销率高达 50 倍。相比之下,即使在互联网泡沫鼎盛时期,也很少有公司能达到如此高的估值倍数。Anthropic 的估值为 1700 亿美元,而其收入仅为 22 亿美元,市盈率约为 77 倍。这些数据表明,该公司的估值严重过高。
尤其令人担忧的是已经形成的循环融资结构。英伟达向OpenAI投资1000亿美元,而OpenAI则有义务购买价值数百亿美元的英伟达芯片。OpenAI与AMD也达成了类似的交易,金额高达数百亿美元。微软已向OpenAI投资超过130亿美元,并将其基础设施托管在Azure云平台上。亚马逊向Anthropic投资80亿美元,而Anthropic则使用AWS作为其主要云平台,并采用亚马逊自家的AI芯片。
这些安排令人毛骨悚然地想起上世纪90年代末的循环融资,当时科技公司相互出售设备,并将交易计入收入,而没有产生任何实际经济价值。分析人士指出,日益复杂且不透明的商业关系网络正在推动万亿美元的繁荣。这与互联网泡沫和2008年金融危机有着明显的相似之处:不透明且非常规的融资机制,令投资者难以理解和评估。
此外,资本集中也是一个重要因素。美国七大科技巨头(即“七大巨头”)在2023年的能源消耗量增长了19%,而标普500指数成分股的能源消耗中位数则停滞不前。预计2025年美国股市约80%的涨幅将归功于人工智能相关公司。仅英伟达一家就成为散户投资者最青睐的股票,他们在2024年向这家芯片制造商投入了近300亿美元。
这种极高的集中度蕴含着系统性风险。如果回报预期不切实际,市场崩盘可能会产生深远的影响。摩根大通估计,仅人工智能相关的投资级债券发行量到2030年就可能达到1.5万亿美元。这些债务大多基于人工智能系统将大幅提高生产力的假设。如果这一预期未能实现,信贷危机将迫在眉睫。
适合:
人才争夺战与社会动荡
经济紧张局势也反映在劳动力市场。人工智能领域的空缺职位与合格候选人的比例为3.2比1。虽然有160万个空缺职位,但只有51.8万名合格的申请者。这种极度短缺导致薪资水平飙升至天文数字。人工智能专家可以通过掌握Python、TensorFlow或专业人工智能框架等技能,每年增加数万美元的收入。
竞争异常残酷。大型科技公司、资金雄厚的初创公司,甚至各国政府都在争夺同一批专家。OpenAI 近几个月来经历了高管离职潮,包括联合创始人 Ilya Sutskever 和首席技术官 Mira Murati。许多优秀人才正在创办自己的初创公司或跳槽到竞争对手。Meta 正在积极从 OpenAI、Anthropic 和 Google 挖角。Anthropic 则在从 Meta 和 OpenAI 挖角。
这种动态会带来几个后果。首先,它使研究格局碎片化。不同机构的小团队不再朝着共同目标努力,而是竞相争夺相同的突破性进展。其次,它推高了成本。人工智能专家的高额薪酬只有资金雄厚的公司才能负担得起,这使得规模较小的公司被排除在市场之外。第三,它延误了项目进度。各公司反映,空缺职位长期无人填补,扰乱了开发计划。
人工智能的社会影响远远超出科技领域。如果人工智能真的代表着下一场工业革命,那么劳动力市场即将迎来一场巨大的变革。与主要影响体力劳动的第一场工业革命不同,人工智能的目标是认知任务。不仅简单的数据录入和客户服务工作会受到威胁,程序员、设计师、律师和记者等高技能职业也可能面临同样的风险。
一项针对投资管理行业的研究预测,人工智能和大数据将导致劳动收入份额下降5%。这与工业革命期间的变革类似,当时劳动收入份额下降了5%至15%。关键区别在于:当前的变革是在数年内而非数十年内发生的。社会几乎没有时间来适应。
测试时计算与范式转变
尽管预训练的扩展规律已接近极限,但一种新的范式已经出现:测试时计算扩展。OpenAI 的 o1 模型证明,通过在推理阶段投入更多计算能力,可以显著提升性能。这些系统并非简单地增加模型规模,而是允许模型对查询进行更长时间的思考,尝试多种解决方案,并进行自我验证。
然而,研究表明这种范式也存在局限性。序列扩展(即模型多次迭代解决同一问题)并不能带来持续改进。对 Deepseeks R1 和 QwQ 等模型的研究表明,更长的思考过程并不会自动产生更好的结果。通常情况下,模型会将正确的答案修正为错误的答案,而不是反过来。有效序列扩展所需的自我修正能力尚未得到充分发展。
并行扩展,即同时生成多个解决方案并选择最佳方案,可以取得更好的结果。然而,同样地,随着计算能力投入的翻倍,边际收益会递减,成本效益迅速下降。对于每天需要处理数百万次查询的商业应用而言,成本高昂到令人难以承受。
真正的突破可能在于融合不同的方法。将Transformer与状态空间模型相结合的混合架构有望融合两者的优势。像Mamba这样的状态空间模型在推理方面具有线性扩展性,而Transformer则擅长捕捉长程依赖关系。这种混合系统有望重新平衡成本与质量之间的关系。
变形金刚之后的替代架构和未来
除了世界模型之外,一些新兴的架构也对Transformer的统治地位构成了挑战。状态空间模型近年来取得了显著进展。S4、Mamba和Hyena等模型证明,高效的长上下文推理和线性复杂度是可行的。Transformer的复杂度随序列长度呈二次方增长,而状态空间模型在训练和推理方面均实现了线性增长。
这些效率提升在人工智能系统部署到生产环境时至关重要。推理成本常常被低估。训练是一次性投资,但推理却持续运行。ChatGPT 从不离线。每天数十亿次的查询,即使是微小的效率提升也能带来巨大的成本节约。一个模型只需一半的计算能力就能达到相同的质量,这使其拥有巨大的竞争优势。
挑战在于这些技术的成熟度。Transformer架构拥有近八年的领先优势,并积累了庞大的工具、库和专业知识生态系统。替代架构不仅要在技术上更胜一筹,还要具备实际应用价值。技术发展史上不乏技术上更胜一筹却因生态系统不足而最终失败的例子。
有趣的是,中国参赛者也采用了另辟蹊径的方法。DeepSeek V3 是一款开源模型,拥有 6710 亿个参数,它使用混合专家架构,每个 token 仅激活 370 亿个参数。该模型在基准测试中取得了与西方竞争对手相当的性能,但训练成本却低得多。其训练时间仅为 278.8 万 H800 GPU 小时,远低于同类模型。
这一发展表明,技术领先地位并非必然掌握在财力最雄厚的企业手中。巧妙的架构决策和优化可以弥补资源劣势。对于全球人工智能格局而言,这意味着多极化趋势日益加剧。中国、欧洲和其他地区正在发展各自的发展路径,而非简单地复制西方模式。
重新评估和不可避免的后遗症
所有这些因素的汇聚预示着人工智能行业即将迎来重新评估。目前的估值基于模型性能和商业应用持续指数级增长的假设。然而,这两个假设都越来越值得怀疑。模型性能停滞不前,而成本却持续飙升。尽管商业应用正在增长,但盈利仍然面临挑战。
OpenAI 的估值高达五千亿美元,要想支撑其估值,其年收入至少需要增长到 1000 亿美元,并在未来几年实现盈利。这意味着短短几年内,其营收需要增长十倍。相比之下,谷歌用了十多年才将营收从 100 亿美元增长到 1000 亿美元。人们对人工智能公司的期望过高,这显然是不切实际的。
分析师警告称,人工智能泡沫可能破裂。这与互联网泡沫的相似之处显而易见。当时和现在一样,都出现了具有巨大潜力的革命性技术。当时和现在一样,都出现了估值过高和循环融资结构。当时和现在一样,投资者都以技术将改变一切、传统估值指标不再适用为由,为荒谬的估值辩护。
关键区别在于:与许多互联网公司不同,如今的人工智能公司拥有真正有价值的实用产品。ChatGPT并非空谈,而是一项每天被数百万人使用的技术。问题不在于人工智能是否有价值,而在于它的价值是否足以支撑目前的估值。答案很可能是否定的。
重新估值到来之时,必将痛苦不堪。风险投资基金已将70%的资金投入人工智能领域。养老基金和机构投资者也面临着巨大的风险敞口。人工智能估值的大幅下跌将产生深远的金融影响。依赖低成本融资的公司将突然难以筹集资金。项目将被叫停,员工将被裁员。
长远视角和前进方向
尽管短期前景黯淡,但人工智能的长期潜力依然巨大。当前的炒作并不能改变这项技术的根本重要性。问题不在于人工智能能否兑现其承诺,而在于它将如何以及何时兑现承诺。勒昆从短期产品开发转向长期基础研究的做法,为我们指明了方向。
下一代人工智能系统很可能与当今的语言学习模型(LLM)截然不同。它将融合世界模型、替代架构和新型训练范式等元素。它将减少对蛮力式扩展的依赖,更多地依赖高效的结构化表示。它将从物理世界而非文本中学习。它将理解因果关系,而不仅仅是相关性。
然而,实现这一愿景需要时间、耐心以及开展基础研究的自由。这些条件在当前的市场环境下很难找到。企业面临着巨大的压力,必须迅速取得商业成功。季度报告和评估轮次占据了议程的大部分。需要数年才能产生结果的长期研究项目难以获得认可。
勒昆65岁高龄创办初创公司,这本身就是一个非凡的决定。他本可以功成身退,功成名就,名垂青史。然而,他却选择了一条充满荆棘的道路,去追求一个被行业主流所摒弃的愿景。Meta仍将是他的合作伙伴,这意味着他的公司至少在初期会拥有资源。但公司真正的成功将取决于他能否在未来几年证明,先进的机器智能确实更胜一筹。
这一转型将耗时数年。即便勒昆的观点正确,世界模型在本质上更胜一筹,它们仍然需要开发、优化和产业化。生态系统需要构建。开发者需要学习如何使用新工具。企业需要从生命周期管理(LLM)迁移到新系统。历史上,这些过渡阶段总是充满挑战。
从炒作到现实:人工智能的长期发展方向
Yann LeCun离开Meta不仅仅意味着人事变动,它象征着科学愿景与商业实用主义、长期创新与短期市场需求之间根本性的矛盾。当前的AI革命正处于转折点,规模化扩张的捷径已经过去,接下来的道路将更加艰难、昂贵且充满不确定性。
对投资者而言,这意味着需要认真审视当前人工智能领军企业的过高估值。对企业而言,这意味着通过人工智能快速提升生产力的希望可能会落空。对社会而言,这意味着变革的进程将比炒作浪潮所展现的更为缓慢和不均衡。
与此同时,其基础依然稳固。人工智能并非昙花一现的潮流,而是一项基础性技术,它将在长期内变革几乎所有经济领域。将其与工业革命相提并论十分贴切。正如工业革命一样,必将出现赢家和输家、过度发展和修正、动荡和调整。问题不在于变革型架构是否已达到其能力极限,而在于下一阶段将呈现怎样的面貌,以及谁将引领它。
乐坤押注于先进的机器智能和世界模型,这固然大胆,但或许极具远见。五年后,我们将见分晓,当初脱离主流是否明智,或者行业是否依然固守成规。未来几年对于人工智能的长期发展至关重要,进而影响到经济和社会的未来。
我们在美国的业务开发、销售和营销方面的专业知识
行业重点:B2B、数字化(从AI到XR)、机械工程、物流、可再生能源和工业
更多相关信息请点击这里:
具有见解和专业知识的主题中心:
- 全球和区域经济、创新和行业特定趋势的知识平台
- 收集我们重点领域的分析、推动力和背景信息
- 提供有关当前商业和技术发展的专业知识和信息的地方
- 为想要了解市场、数字化和行业创新的公司提供主题中心
您的全球营销和业务发展合作伙伴
☑️我们的业务语言是英语或德语
☑️ 新:用您的国家语言进行通信!
我很乐意作为个人顾问为您和我的团队提供服务。
您可以通过填写此处的联系表,或者直接致电+49 89 89 674 804 (慕尼黑)。我的电子邮件地址是: wolfenstein ∂ xpert.digital
我很期待我们的联合项目。
☑️ 为中小企业提供战略、咨询、规划和实施方面的支持
☑️ 创建或调整数字战略和数字化
☑️国际销售流程的扩展和优化
☑️ 全球数字 B2B 交易平台
☑️ 先锋业务发展/营销/公关/贸易展览会
🎯🎯🎯 受益于 Xpert.Digital 全面的五重专业知识和全面的服务包 | BD、研发、XR、PR 和数字可视性优化
Xpert.Digital 对各个行业都有深入的了解。 这使我们能够制定量身定制的策略,专门针对您特定细分市场的要求和挑战。 通过不断分析市场趋势并跟踪行业发展,我们可以前瞻性地采取行动并提供创新的解决方案。 通过经验和知识的结合,我们创造附加值并为客户提供决定性的竞争优势。
更多相关信息请点击这里:


