网站图标 Xpert.Digital

人工智能芯片的炒作与现实:数据中心的未来——自主研发与市场饱和

人工智能芯片的炒作与现实:数据中心的未来——自主研发与市场饱和

人工智能芯片的炒作与现实:数据中心的未来——内部研发与市场饱和——图片来源:Xpert.Digital

英伟达的垄断地位正在动摇:科技巨头们点燃了芯片大战的下一阶段——一场价值数十亿美元的人工智能芯片争夺战

数据中心面临的终极挑战:内部研发遭遇迫在眉睫的市场饱和。

人工智能领域正经历着前所未有的繁荣,这主要源于对计算能力近乎永无止境的需求。而这股热潮的核心正是人工智能芯片,尤其是市场领导者英伟达的GPU,它们已成为数字时代的黄金。然而,在幕后,一场战略转型正在悄然发生,并可能重塑整个科技行业的权力格局。这些芯片的最大买家——微软、谷歌和亚马逊等超大规模数据中心巨头——不再满足于仅仅作为客户。他们投入数十亿美元,开发自主定制的半导体产品,例如微软的Maia、谷歌的TPU和亚马逊的Trainium。.

其动机显而易见:降低成本,减少对单一供应商的依赖,并根据自身的人工智能模型,从芯片到散热系统,对整个基础设施进行完美定制。最初旨在优化性能的务实商业决策,如今却引发了根本性的竞争,并首次对英伟达的统治地位构成了严峻挑战。然而,在围绕最强大人工智能基础设施的军备竞赛愈演愈烈、数千亿美元投入的同时,关于市场过热的警告也日益响亮。专家们将此次事件与以往的投机泡沫相提并论,并警告称,未来几年市场将出现饱和和产能过剩。.

本文深入剖析了人工智能芯片的热潮,揭示了其背后的真相:为什么科技巨头们依赖内部研发?他们的研发进度究竟有多快?当指数级增长的需求突然崩溃,人工智能无限增长的梦想与经济调整的残酷现实碰撞时,又会发生什么?

与此相关:

是什么促使超大规模数据中心运营商开发自己的芯片?

大型云服务提供商(也称超大规模云服务商)面临着一项根本性的战略决策:是继续依赖英伟达和AMD等老牌芯片制造商,还是应该逐步转向自主研发半导体?微软首席技术官凯文·斯科特最近就此问题发表了看法,他表示微软计划长期主要依赖其自主研发的Maia芯片。这种战略并非首创——谷歌的TPU和亚马逊的Trainium芯片也都在采取类似的策略。.

这一发展的主要原因在于成本优化。对于超大规模数据中心而言,性价比是决定性因素,正如斯科特强调的那样:“我们并非执着于使用哪家芯片。这意味着多年来,英伟达一直是性价比最高的选择。我们乐于接受所有能够确保我们拥有足够产能来满足需求的方案。” 这段话表明,这并非是对现有供应商的彻底否定,而是一项务实的商业决策。.

自主研发芯片还能帮助超大规模数据中心优化整个系统架构。例如,微软可以利用其 Maia 芯片,不仅调整计算能力,还能根据自身需求定制散热、网络和其他基础设施组件。斯科特解释说:“这关乎整个系统设计。它涵盖网络和散热,你需要能够自由地做出必要的决策,从而真正针对工作负载优化计算能力。”.

各个超大规模数据中心运营商的内部研发进展如何?

三大云服务提供商在定制芯片战略的开发方面处于不同的阶段。亚马逊云服务(AWS)是该领域的先驱,早在2018年就推出了首款Graviton芯片,奠定了基础。AWS目前已推出第四代Graviton处理器,专为通用计算工作负载而设计。与此同时,亚马逊还开发了专用的AI芯片:用于训练的Trainium和用于推理机器学习模型的Inferentia。.

数据证明了这一战略的成功:过去两年,Graviton 处理器占 AWS 数据中心所有 CPU 容量的 50% 以上。AWS 还报告称,超过 5 万家客户正在使用基于 Graviton 的服务。尤其令人印象深刻的是其实际部署:在 2024 年 Prime Day 期间,亚马逊部署了 25 万个 Graviton 芯片和 8 万个其定制的 AI 芯片。.

谷歌在张量处理单元 (TPU) 方面采取了不同的策略,早期就专注于人工智能专用硬件。TPU 目前已发展到第七代,并且仅通过谷歌云平台提供。谷歌最近还发布了其首款基于 Arm 架构的通用处理器 Axion,该公司声称其性能比其他云服务提供商提供的同类 Arm 架构实例高出 30%。.

微软在这场竞赛中起步较晚。该公司直到 2023 年底才发布其首批自主设计的芯片:Azure Maia AI 加速器和 Azure Cobalt CPU。Cobalt CPU 已于 2024 年 10 月正式发布,它基于 64 位架构,拥有 128 个核心,采用台积电 (TSMC) 的 5 纳米工艺制造。微软声称,Cobalt 的性能比 Azure 中之前基于 Arm 的产品提升高达 40%。.

为什么我们自己的芯片无法满足全部需求?

尽管内部研发取得了进展,但所有超大规模数据中心仍远未实现完全依靠自主研发芯片满足需求。主要原因在于市场规模庞大且需求增长迅速。微软的凯文·斯科特对此总结得非常精辟:“说计算能力严重短缺可能都算是轻描淡写了。自从ChatGPT发布以来,几乎不可能快速扩展计算能力。”.

这些数据凸显了挑战的规模:受人工智能需求驱动,预计到2027年,全球数据中心容量将增长50%。仅大型科技公司就计划到2025年投资超过3000亿美元用于人工智能基础设施建设。按照这样的增长速度,仅靠内部芯片研发根本无法满足全部需求。.

此外,制造工艺也存在技术限制。最先进的芯片仅由少数几家代工厂生产,例如台积电,而且产能有限。微软、谷歌和亚马逊不得不与其他客户共享这些产能,这限制了它们自身芯片的供应量。另一个因素是研发周期:尽管市场需求呈爆炸式增长,但开发一款新芯片却需要数年时间。.

因此,超大规模数据中心运营商正在采取混合策略。他们针对特定工作负载开发自有芯片,以发挥其最大优势,并辅以英伟达、AMD 和英特尔的芯片,以满足其他应用场景的需求。斯科特解释说:“我们并不执着于芯片的品牌。关键在于最佳的性价比。”.

定制硅解决方案有哪些经济优势?

自主研发芯片的经济动力十分强劲。研究表明,对于大型语言模型,AWS Trainium 和 Google TPU v5e 的单代币成本比高端 Nvidia H100 集群低 50% 到 70%。一些分析甚至证明,在训练大型语言模型方面,TPU 方案的成本效益比 GPU 方案高出四到十倍。.

这些成本节约源于以下几个因素。首先,芯片可以根据工作负载的具体需求进行精确定制,从而提高效率。其次,芯片制造商的利润被消除,考虑到超大规模数据中心巨大的产能,这将带来显著的成本节约。第三,垂直整合能够更好地控制整个供应链。.

例如,亚马逊报告称,SAP 使用基于 Graviton 的 EC2 实例后,分析工作负载的性能提升了 35%。谷歌表示,其 TPU v5e 通过连续批处理技术,每美元的推理吞吐量是上一代 TPU 的三倍。微软声称,其 Cobalt CPU 在 Java 工作负载中性能提升高达 1.5 倍,在 Web 服务器中性能提升高达两倍。.

从长远来看,其财务影响十分显著。由于投资总额高达数千亿美元,即使是微小的效率提升也能带来巨大的成本节约。专家估计,到2035年,云环境中定制芯片的市场规模可能达到600亿美元。.

与此相关:

芯片市场的竞争形势发展如何?

超大规模数据中心内部研发的日益普及正在从根本上改变传统的芯片行业。长期以来在人工智能加速器领域占据绝对市场领导地位的英伟达,如今首次面临严峻的竞争。科尔尼咨询公司的分析师预测,像谷歌的TPU、AWS Trainium和微软的Maia这样的超大规模数据中心自主研发的芯片解决方案,作为内部实现方案,其市场份额可能达到15%至20%。.

这一发展趋势迫使传统芯片制造商重新定位自身。例如,AMD 正试图凭借其 MI300 系列直接挑战英伟达,同时加强与云服务提供商的合作关系。英特尔虽然在人工智能芯片领域的地位不如英伟达,但仍受益于为超大规模数据中心定制的至强处理器,AWS 最近发布的 R8i 实例便证明了这一点。.

超大规模数据中心运营商的不同战略进一步加剧了竞争格局。谷歌目前仅将其TPU用于内部运营,并通过谷歌云平台提供,而其他供应商未来可能会将其芯片推向市场。供应商的多元化发展有助于形成更良性的竞争,并加速创新周期。.

另一个重要方面是地缘政治因素。鉴于中美之间的紧张关系,美国超大规模数据中心运营商正加大对自身芯片制造能力的投资,以减少对亚洲供应商的依赖。与此同时,百度及其昆仑芯片等中国企业正在崛起,成为芯片制造领域的领军者。.

 

借助“托管人工智能”(人工智能)实现数字化转型的新维度——平台及B2B解决方案 | Xpert咨询

“托管式人工智能”开启数字化转型新篇章——平台及B2B解决方案 | Xpert Consulting - 图片来源:Xpert.Digital

在这里,您将了解到您的公司如何快速、安全地实施定制化的人工智能解决方案,且无需承担过高的准入门槛。.

托管式人工智能平台是您实现人工智能的全方位、无忧解决方案。您无需处理复杂的技术、昂贵的基础设施和漫长的开发流程,即可从专业合作伙伴处获得根据您的需求量身定制的现成解决方案——通常只需几天时间。.

主要优势一览:

⚡ 快速实施:从构思到可立即使用的应用,只需几天而非几个月。我们提供切实可行的解决方案,创造即时附加值。.

🔒 最高数据安全保障:您的敏感数据始终由您掌控。我们保证安全合规地处理您的数据,绝不与任何第三方共享。.

💸 无财务风险:您只需为结果付费。完全无需前期投入大量资金用于硬件、软件或人员。.

🎯 专注于您的核心业务:集中精力做好您最擅长的事情。我们将负责您人工智能解决方案的全部技术实施、运营和维护。.

📈面向未来且可扩展:您的AI将与您一同成长。我们确保持续优化和可扩展性,并灵活调整模型以适应新的需求。.

更多信息请点击这里:

 

人工智能热潮与芯片短缺:数据中心泡沫何时会破裂?

当前的需求趋势对市场意味着什么?

目前,对计算能力的需求,尤其是人工智能应用方面的需求,正呈指数级增长。英伟达估计,推理模型的响应所需的计算资源是前几代产品的100倍以上。这种发展趋势导致先进芯片和数据中心容量出现结构性短缺。.

麦肯锡的分析显示,到2030年,全球数据中心容量需求可能增长两倍,年增长率约为22%。在美国,这一需求甚至可能达到每年20%至25%。预计到2030年,约70%的需求将来自超大规模数据中心运营商。.

需求的激增正引领着行业格局的转变。Synergy Research Group预测,到2030年,超大规模数据中心运营商将占据全球数据中心容量的61%,高于目前的44%。与此同时,本地部署数据中心的份额预计将从目前的34%下降到2030年的22%。.

高需求也导致整个供应链出现瓶颈。高带宽内存、CoWoS等先进封装技术以及专用基板已经售罄数月。例如,英伟达报告称,其下一代Blackwell GPU的供货量已经排到了一年甚至更久之后。.

与此相关:

何时可能出现产能过剩?

数据中心潜在的产能过剩问题极具争议。多位专家已发出警告,人工智能泡沫的规模可能超过上世纪90年代的互联网泡沫。独立研究公司MacroStrategy Partnership声称,当前的人工智能泡沫规模是互联网泡沫的17倍,是2008年房地产泡沫的4倍。.

高盛首席执行官大卫·所罗门警告称,由于大量资金涌入人工智能项目,未来几年股市可能会出现下跌。他解释说:“我认为很多资金被投入到最终会被证明无利可图的项目中,而当这种情况发生时,人们的情绪会很糟糕。”亚马逊首席执行官杰夫·贝佐斯在同一会议上也证实,人工智能行业存在泡沫。.

种种迹象表明,情况正在恶化:MacroStrategy Partnership 的 Julien Garran 指出,企业采用大型语言模型的比例已经开始下降。他还认为 ChatGPT 可能已经“遇到了瓶颈”,因为最新版本的价格是之前的十倍,但性能并没有明显提升。.

另一方面,近期市场数据显示,需求持续超过供应。世邦魏理仕(CBRE)报告称,2024年初北美主要数据中心市场的空置率降至2.8%的历史新低。尽管数据中心供应量实现了年度最大增幅,但空置率依然保持低位,这表明数据中心市场的基本面依然强劲。.

潜在市场整合的合理时间范围是多久?

准确预测潜在市场整合的时机极其困难,因为它取决于许多未知因素。然而,分析师已经确定了几个市场动态可能发生变化的关键时期。.

第一个关键时期在2026年至2027年之间。多项因素表明,在此期间增长率可能会放缓。超大规模数据中心运营商已计划在2026年削减20%至30%的投资,这表明市场已趋于饱和或正在进行重新评估。.

半导体行业预计,人工智能芯片的需求将在2026年至2027年间达到初步的平稳期。晶圆的年增长率可能会从目前的14%至17%降至4%左右。这将是产能规划的一个重要转折点。.

第二个关键时期大约在2028年至2030年。届时,第一代大规模人工智能基础设施投资可能需要实现投资回报。如果届时仍未涌现出足够多的盈利应用案例,市场可能会出现回调。麦肯锡预测,到2030年,数据中心容量需求将增长两倍,但这些预测基于对人工智能普及程度的假设,而这些假设可能过于乐观。.

关键因素在于人工智能应用能否持续盈利。TS Lombard 的 Dario Perkins 警告称,在竞争的驱动下,科技公司为了建设人工智能数据中心而背负巨额债务,却忽视了回报。这种情况令人想起过去的泡沫,如果回报未能达到预期,可能会导致市场回调。.

产能过剩会带来哪些影响?

数据中心容量过剩将对整个科技行业产生深远影响。初期,这将导致云服务价格大幅下降。虽然短期内这对客户有利,但可能会严重影响超大规模数据中心运营商的盈利能力,并导致市场整合。.

这将对就业产生重大影响。预计最早到2025年,科技行业将有超过25万名员工面临裁员,而市场调整将加剧这一趋势。数据中心运营、芯片研发及相关领域将受到尤为严重的影响。.

对于半导体行业而言,产能过剩的后果将尤为严重。对先进芯片制造产能的巨额投资可能会被证明是过度的。三星已经公布,由于人工智能芯片需求疲软,其2025年第二季度的利润下降了39%,这或许预示着未来可能出现类似的情况。.

市场整合很可能导致权力集中在实力最强的几家供应商手中。规模较小的云服务提供商和数据中心运营商可能会被大型公司收购,或者被迫退出市场。从长远来看,这可能导致竞争减少和价格上涨。.

另一方面,调整也可能带来积极影响。它可以淘汰低效产能,并将资源重新分配到更高效的用途上。幸存下来的公司可能会更强大,也更具可持续发展能力。此外,整合还有助于促进标准的制定和互操作性的提升。.

企业如何应对不同的情况?

鉴于未来市场发展的不确定性,超大规模数据中心运营商和其他公司正在采取各种策略来降低风险。其中最重要的是芯片战略多元化。正如微软首席技术官凯文·斯科特所强调的那样,他们“对所有选项都持开放态度”,以确保充足的产能。.

微软不仅自主研发芯片,还持续投资与英伟达、AMD 及其他供应商的合作。这种多供应商策略降低了对单一供应商的依赖风险,使其能够快速应对市场变化。亚马逊和谷歌也采取了类似的策略,尽管它们的侧重点有所不同。.

另一个重要方面是地域多元化。鉴于像北弗吉尼亚这样的成熟市场存在“邻避效应”(NIMBY),超大规模数据中心运营商正越来越多地将投资转移到二线市场和海外。这不仅可以降低成本,还可以降低监管风险。.

超大规模数据中心运营商也在加大对能源效率和可持续技术的投资。鉴于数据中心的能源消耗到2028年可能翻一番,这既是经济上的必然选择,也是监管上的必然要求。液冷、更高效的芯片和可再生能源正逐渐成为标配。.

最后,许多公司正在开发更灵活的商业模式。他们不再仅仅依赖自有设施,而是越来越多地采用与托管服务提供商和其他合作伙伴的混合模式。这使他们能够根据市场情况更快地扩展或缩减容量。.

监管因素发挥什么作用?

监管政策的发展可能对数据中心市场的未来发展起到至关重要的作用。在美国,越来越多的人支持加强对数据中心能源消耗的监管。一些州已经在考虑暂停批准新的大型数据中心用户,或实施更严格的审计程序。.

环境影响日益受到关注。到2028年,数据中心可能占全球能源消耗的20%,这可能导致更严格的环境法规出台。欧盟已推出《气候中和数据中心公约》,目前已有超过40家数据中心运营商加入。.

地缘政治紧张局势也对该行业产生影响。对半导体征收潜在关税可能会推高芯片成本并扰乱供应链。这可能迫使超大规模数据中心运营商重新思考其采购策略,并更加依赖区域供应商。.

数据隐私和数据主权也日益成为重要因素。许多国家要求某些数据必须在本地处理,这限制了数据中心的全球规模化发展。这可能导致市场碎片化,并降低规模经济带来的效率提升。.

监管也能起到积极的推动作用。政府通常会对可持续技术和可再生能源的投资提供补贴。此外,监管要求可以推动标准的制定,从长远来看,这将提高整个行业的效率。.

与此相关:

在增长与风险之间寻求平衡

数据中心行业正处于关键的转折点。微软、谷歌和亚马逊等超大规模数据中心企业自主研发芯片,是对成本飙升和现成解决方案供应有限的必然回应。这一策略不仅能带来显著的经济优势,还能更好地掌控整个基础设施。.

与此同时,产能过剩的风险真实存在,并可能导致2026年至2030年间出现大幅市场调整。从人工智能技术普及速度放缓到业内知名人士对泡沫的警告,各种预警信号层出不穷。潜在的行业整合将带来机遇,同时也伴随着挑战。.

人工智能行业的未来取决于对人工智能基础设施的巨额投资能否持续盈利。超大规模数据中心运营商正通过多元化、地域扩张和灵活的商业模式来应对各种可能出现的情况。监管政策的发展,尤其是在环境和能源领域,将进一步增加问题的复杂性。.

对于企业和投资者而言,这意味着他们必须密切关注巨大的增长机遇和相当大的风险。能够灵活应对市场变化并不断提高运营效率的企业将成为最终的赢家。未来几年将检验当前的扩张是否建立在坚实的基础之上,还是泡沫的警告最终会成真。.

 

您的全球营销和业务拓展合作伙伴

☑️ 我们的业务语言是英语或德语。

☑️ 新增:用您的母语进行通信!

 

Konrad Wolfenstein

我和我的团队很乐意为您提供私人顾问服务。.

您可以通过填写此处的联系表格联系我wolfenstein@xpert.digital,或者直接致电+49 7348 4088 965。我的邮箱地址是

我期待着我们的合作项目。.

 

 

☑️ 为中小企业提供战略、咨询、规划和实施方面的支持

☑️ 制定或调整数字化战略和数字化

☑️ 拓展和优化国际销售流程

☑️ 全球及数字化 B2B 交易平台

☑️ 先锋业务拓展/市场营销/公关/展会

 

我们在业务拓展、销售和市场营销方面拥有全球行业和经济方面的专业知识。

我们在业务拓展、销售和市场营销方面拥有全球行业和经济方面的专业知识 - 图片来源:Xpert.Digital

行业重点领域:B2B、数字化(从人工智能到扩展现实)、机械工程、物流、可再生能源和工业

更多信息请点击这里:

一个提供见解和专业知识的主题中心:

  • 涵盖全球和区域经济、创新和行业特定趋势的知识平台
  • 汇集了我们重点关注领域的分析、见解和背景信息。
  • 这里汇集了有关商业和技术最新发展的专业知识和信息。
  • 一个为寻求市场、数字化和行业创新信息的企业提供的信息中心。
离开移动版