价值 200 亿美元的政变:英伟达如何凭借 Groq 巩固其 AI 垄断地位——黄仁勋对抗谷歌等公司的巧妙举措。.
Xpert 预发布版
语言选择 📢
发布日期:2026年3月18日 / 更新日期:2026年3月18日 – 作者:Konrad Wolfenstein
英伟达收购Groq——并重创数据中心:这项价值200亿美元的整合
硬件已成过去:英伟达的新战略为何正在撼动整个科技界
2026 年 GTC 大会标志着科技行业的一个历史性转折点:英伟达不再仅仅是一家芯片制造商,而是在全世界的注视下构建起一个坚不可摧的人工智能帝国。凭借一项价值 200 亿美元的精明之举——收购推理初创公司 Groq,首席执行官黄仁勋正在弥合公司最大的软肋。但这仅仅是冰山一角:在英伟达 CUDA 软件平台迎来 20 周年之际,这家科技巨头正凭借全新的“Vera Rubin”GPU 架构、巨型桌面超级计算机以及 DLSS 5 等突破性游戏创新,进一步巩固其绝对主导地位。本文将探讨英伟达如何不仅定义未来几年的硬件发展方向,而且根据其自身愿景,彻底塑造未来的数据中心。.
2025 年底,英伟达斥资约 200 亿美元收购了人工智能芯片初创公司 Groq 的股份,获得了其推理技术和大部分团队,而 Groq 则以残余形式继续存在。.
这不应与埃隆·马斯克旗下 xAI 公司推出的 AI 聊天机器人 Grok 混淆:Grok 仍然归 xAI 所有,英伟达只是作为硬件供应商和投资者——这是两家完全不同的公司和产品。.
黄仁勋正在收购推理的未来——但他并不称之为收购——“这不是一次典型的收购”。
从很多方面来看,GTC 2026 都是英伟达历史上最重要的内部技术大会。在来自 190 个国家/地区的 3 万多名与会者面前,黄仁勋在圣何塞的 SAP 中心接连发布了一系列产品——拥有 3360 亿个晶体管的全新 GPU 架构、运算能力达 20 petaflops 的 DGX Station 桌面超级计算机、迪士尼的自主机器人、比亚迪、现代和日产的自动驾驶汽车平台,以及太空人工智能数据中心的雏形。但英伟达早在 2025 年 12 月就以一份异常简短的声明宣布了其真正的战略重磅消息:以 200 亿美元收购人工智能芯片初创公司 Groq。.
与此相关:
CUDA 迎来 20 周年——并且从未像现在这样重要。
在理解 Groq 章节之前,必须先了解其基础架构。在 2026 年 GTC 大会上,英伟达的 CUDA 编程平台迎来了 20 周年纪念。CUDA 于 2006 年推出,最初是一个软件接口,允许开发者利用图形处理器强大的并行计算能力进行通用数值计算。如今,CUDA 已成为全球人工智能基础设施的基石。.
值此周年之际,黄仁勋将CUDA比作飞轮:该平台带来的技术进步不断吸引着新用户,而这些新用户反过来又开发出新的应用和理念,进一步扩展了生态系统。这种自我强化的效应正是英伟达市场力量的核心所在。CUDA拥有超过400个库,其中包含几乎所有科学计算和人工智能领域的算法的GPU优化实现,如今已深深融入研究人员、开发人员和企业的日常工作流程,以至于切换到其他硬件平台将带来巨大的成本。目前还没有其他芯片制造商构建出如此密集的软件生态系统。.
但CUDA虽然强大,却存在一个结构性缺陷,黄仁勋也越来越公开地承认这一点:尽管英伟达的GPU在AI模型训练阶段几乎无人能敌,但在推理领域——即快速高效地将训练好的模型应用于新的查询——来自专用芯片的压力正在显著增加。谷歌正在构建自己的张量处理单元(Tensor Processor Unit,TPU),亚马逊正在开发Trainium和Inferentia,微软则在投资定制芯片设计。正是在这种背景下,Groq应运而生。.
Groq交易:斥资200亿美元打造推理的未来
Groq 在人工智能芯片领域可谓家喻户晓。这家初创公司由前谷歌工程师 Jonathan Ross 于 2016 年创立,他曾参与 TPU 的开发并发挥了关键作用。Groq 凭借其截然不同的架构方法而声名鹊起。其语言处理单元 (LPU) 专为极速高效地执行推理工作负载而优化,在纯推理速度基准测试中,其性能往往显著优于传统的 GPU 架构。Groq 的 GroqCloud 服务为开发者提供了这些 LPU 的使用权限,并因其卓越的令牌生成速度而闻名于开发者社区。.
英伟达在2025年12月宣布的交易结构在法律上十分特殊:英伟达并没有像对待Groq那样整体收购该公司(考虑到两家公司的市场地位,这样做会引发严重的垄断担忧),而是签署了一份价值200亿美元的Groq芯片技术许可协议,并同时将Groq的领导团队,包括创始人兼首席执行官乔纳森·罗斯,招入英伟达麾下。据报道,该许可协议并非排他性的——理论上,Groq可以继续作为一家独立公司运营,提供推理云服务。然而,业内人士认为,随着Groq核心人员的离职,其人工智能芯片的创新能力已基本被英伟达吸收。.
黄仁勋在宣布这笔交易时,曾做过一个颇具洞察力的历史类比:他认为 Groq 与 Mellanox 非常相似——Mellanox 是一家网络技术公司,英伟达在 2019 年以 69 亿美元收购了该公司,此举对整个数据中心行业产生了变革性的影响。Mellanox 为英伟达带来了 InfiniBand 网络技术,该技术能够将数千个 GPU 连接起来,形成一个庞大的、协同的计算集群——如果没有这项技术,训练当今标准的大型语言模型将是不可能的。Groq 的目标是在推理端提供类似的功能:一种专用的加速器架构,可以与 GPU 协同工作,为模型提供服务,并显著提高整个平台的效率。.
借助“托管人工智能”(人工智能)实现数字化转型的新维度——平台及B2B解决方案 | Xpert咨询
在这里,您将了解到您的公司如何快速、安全地实施定制化的人工智能解决方案,且无需承担过高的准入门槛。.
托管式人工智能平台是您实现人工智能的全方位、无忧解决方案。您无需处理复杂的技术、昂贵的基础设施和漫长的开发流程,即可从专业合作伙伴处获得根据您的需求量身定制的现成解决方案——通常只需几天时间。.
主要优势一览:
⚡ 快速实施:从构思到可立即使用的应用,只需几天而非几个月。我们提供切实可行的解决方案,创造即时附加值。.
🔒 最高数据安全保障:您的敏感数据始终由您掌控。我们保证安全合规地处理您的数据,绝不与任何第三方共享。.
💸 无财务风险:您只需为结果付费。完全无需前期投入大量资金用于硬件、软件或人员。.
🎯 专注于您的核心业务:集中精力做好您最擅长的事情。我们将负责您人工智能解决方案的全部技术实施、运营和维护。.
📈面向未来且可扩展:您的AI将与您一同成长。我们确保持续优化和可扩展性,并灵活调整模型以适应新的需求。.
更多信息请点击这里:
忘掉你之前对英伟达的一切了解吧:该公司的真实计划已经曝光。
技术细节:Groq 3 在 GTC 2026 大会上亮相
在GTC大会上,英伟达公布了Groq技术的具体集成规格,并将其命名为Groq 3 LPU。这些数据令人印象深刻:500兆字节的SRAM,150TB/s的内存带宽,每兆瓦的推理吞吐量比基于GPU的方案高35倍,每个机架可容纳256个LPU,总带宽达40PB/s。这些规格精准地解决了大规模部署LLM时最棘手的瓶颈:为数百万并发用户提供服务模型时的延迟和功耗问题。.
对于英伟达的客户——例如AWS、Azure和谷歌云等超大规模云服务提供商——而言,这种集成将带来显著的效率提升。谷歌云在GTC大会上宣布,通过使用优化的英伟达基础设施,成本降低了76%。这不再是渐进式的改进,而是对人工智能服务经济模式的重新设计。在机器学习推理运营成本已成为各大科技公司一项重大开支的当下,将这些成本减半甚至降低四分之三,意味着一项具有重要战略意义的竞争优势。.
与此相关:
GTC 的最高成就:1 万亿美元和维拉·鲁宾
除了Groq系列之外,GTC 2026还发布了一系列其他具有历史意义的公告。英伟达预计到2027年其采购订单额将达到1万亿美元——即使对于英伟达这样增长势头强劲的公司而言,这也是一个全新的里程碑。全新的Vera Rubin GPU架构拥有3360亿个晶体管,是当前Blackwell架构的1.6倍,预计将于2026年下半年发布,单个NVL72机架即可提供3.6 exaflops的FP4计算能力。这种单机计算能力密度,在几年前相当于一个完整的数据中心。.
英伟达宣布将于2028年推出Feynman架构:其性能是Blackwell的14倍,采用台积电1.6纳米硅光子工艺制造,并可扩展至NVL1152尺寸。这意味着,即使假设Groq等专用硬件能够大幅提升AI训练和推理效率,英伟达也已制定了至少未来三年的详细硬件路线图。其战略目标清晰明确:英伟达不仅计划主导当前的AI浪潮,更要引领未来两到三代硬件的发展方向。.
DLSS-5方案:一个附带争议的故事
GTC 2026 也发布了一些面向广大消费者的公告。英伟达面向视频游戏推出的最新版本深度学习超级采样技术 DLSS 5 承诺实现实时全神经渲染,并计划于 2026 年秋季发布,首批支持的游戏包括《生化危机》、《霍格沃茨之遗》和《星空》。对此,各方反应不一:一些人认为 DLSS 5 是一项突破性技术,能够将游戏画面提升到一个新的水平。然而,批评者则认为它只是一个附加滤镜,并没有带来任何真正的技术优势——这场争论反映了游戏社区与半导体行业人工智能驱动的优化逻辑之间潜在的冲突。.
德国发布的DGX Station是一款桌面超级计算机,拥有20千万亿次浮点运算能力、748GB的相干内存,并能在本地运行包含一万亿个参数的模型。这款超级计算机的发布不仅对德国的个人用户和企业意义重大,也标志着高性能人工智能普及化进程中可能出现的重大转变。该系统还提供适用于敏感环境的物理隔离版本,旨在满足日益增长的专业用户群体的需求。这些用户由于监管或数据保护等原因,需要在本地运行人工智能模型。.
结论:英伟达已不再是一家芯片制造商。
GTC 2026 整体展现了英伟达从纯硬件供应商向全栈 AI 基础设施巨头的系统性转型。通过整合 Groq,英伟达正在解决其 GPU 架构推理能力不足的问题。凭借 NemoClaw 和 OpenClaw,它占据了代理中间件层。凭借 Nemotron 联盟以及对开源 AI 模型高达 260 亿美元的投资,它巩固了在模型层的地位。此外,凭借在 AWS 上超过一百万个 GPU 的云交易、DGX Station 产品线以及 Vera Rubin 路线图,英伟达继续在硬件基础架构领域占据主导地位。.
英伟达在当前人工智能市场真正的独特卖点在于,它能够同时处理所有这些层面,并通过CUDA、NeMo、NIM和硬件架构之间的深度集成将它们巧妙地融合在一起。其他任何厂商——无论是谷歌、微软、亚马逊,还是OpenAI——都无法在人工智能堆栈的所有层面上实现如此深入且一致的集成。正如GTC 2026所暗示的那样,未来的数据中心本质上就是英伟达的数据中心——无论从硬件、软件、模型,还是构建于其上的代理基础设施来看,都是如此。.
您的全球营销和业务拓展合作伙伴
☑️ 我们的业务语言是英语或德语。
☑️ 新增:用您的母语进行通信!
我和我的团队很乐意为您提供私人顾问服务。.
您可以通过填写此处的联系表格联系我,或者直接拨打我的电话+49 89 89 674 804 (慕尼黑) 。我的邮箱地址是: [email protected]
我期待着我们的合作项目。.
























