2025 年 12 月 5 日,Cloudflare:继 11 月大停之后,Cloudflare 再次不稳定——互联网脆弱的骨干网。
Xpert 预发布
语言选择 📢
发布日期:2025年12月5日 / 更新日期:2025年12月5日 – 作者:Konrad Wolfenstein
互联网岌岌可危:下一次大规模网络中断只是时间问题。
当数字骨干网崩溃时:互联网基础设施的新现实
不是“是否”,而是“何时”:为什么我们必须习惯持续不断的微扰动
2025年12月5日发生的一系列事件,与此前一系列令人担忧的事件完美契合,使2025年成为数字基础设施发展史上的一个转折点。在那个星期五的早晨,全球数百万互联网用户再次经历了一场令人痛苦的日常:网站显示HTTP 500错误,服务无法访问,甚至像Downdetector这样的故障报告门户网站也因大量错误报告而瘫痪。虽然此次Cloudflare故障的规模可能不及11月份那次毁灭性的故障,但它无情地揭示了我们数字化经济中一个根本性的问题:互联网原本所谓的去中心化架构早已被高度中心化的结构所取代,少数几家公司决定着我们网络社会的运作方式。
适合:
2025年11月地震及其余震
2025年11月18日11:20(UTC),一系列事件开始,并将载入互联网基础设施史册。Cloudflare,这家声称保护着全球约20%网站、并在内容分发网络(CDN)领域占据近80%市场份额的服务商,遭遇了自2019年以来最严重的宕机事件。此次宕机的影响是毁灭性的:X、ChatGPT、Canva、Discord以及无数其他服务陷入了长达数小时的“数字黑暗”。而造成此次宕机的原因既非复杂的网络攻击,也非恶意活动,仅仅是机器人管理系统配置文件中的一个简单内部错误。
这一系列技术事件揭示了现代互联网架构令人担忧的脆弱性。ClickHouse 系统中数据库权限的更改导致一个功能配置文件超出了其预期大小(不足 200 条记录)。这一硬编码限制的突破触发了 Cloudflare 中央代理系统的崩溃,该系统负责处理 Cloudflare 客户的流量。HTTP 5xx 错误迅速蔓延至数百万终端用户。故障排除过程异常棘手:由于问题文件每五分钟自动重新生成一次,且数据库节点以增量方式更新,因此损坏的数据只是零星出现。系统会崩溃,看似恢复,然后再次崩溃。Cloudflare 的工程师最初错误地怀疑是大规模 DDoS 攻击,浪费了宝贵的时间调查错误的场景。
多米诺骨牌效应席卷了整个 Cloudflare 基础设施。核心 CDN 返回 HTTP 5xx 错误,Turnstile 无法加载,Workers KV 报告的错误率急剧上升,大多数用户的访问认证失败。主流量直到 UTC 时间下午 2:30 左右才恢复正常,所有服务的完全恢复则耗时至 UTC 时间下午 5:06。近六个小时的时间里,这家互联网上最重要的基础设施提供商之一一直处于功能受限的状态。
三小时停电的经济影响
此类服务中断造成的经济后果远超大多数用户的想象,他们面对的仅仅是令人沮丧的错误信息。对德国电子商务格局的详细分析揭示了问题的严重性。德国约有 663,719 家在线商店,其中约 80% 使用 Cloudflare 服务来保护其系统和基础设施,这意味着受影响的商店超过 53 万家。德国电子商务行业的年收入约为 470 亿欧元。仅德国在线零售业,一次三小时的服务中断就将造成约 1287 万欧元的直接收入损失。
这些数字乍看之下似乎并不高,但它们仅仅反映了直接的收入损失。由此产生的后续成本呈指数级增长:广告预算因广告活动浪费而损失,未处理交易导致的付款积压,违反与业务合作伙伴的服务水平协议 (SLA) 的行为,在服务中断期间迁移到亚马逊或其他平台且再也没有回来的新客户造成的损失,以及处理投诉的支持成本,远远超过单纯的收入损失。
风险分析公司 CyberCube 估计,仅 2025 年 10 月 AWS 服务中断造成的可保损失就高达 4.5 亿至 5.81 亿美元。此次服务中断导致全球超过 7 万家企业瘫痪,其中包括 2000 多家大型企业。Gartner 计算得出,每分钟停机平均损失 5600 美元;对于大型企业而言,这一数字高达每分钟 2.3 万美元以上。如果将这一数字推算到 Cloudflare 服务中断持续数小时且影响范围更广的情况下,其造成的经济损失将更加惨重。
从经济角度来看,这种依赖性更为显著。消费者门户网站Verivox的一项调查显示,如果德国互联网完全瘫痪,每天将造成近70亿欧元的损失。超过半数的受访职场人士表示,他们每天都依赖互联网;只有13.6%的人表示他们不需要互联网,或者工作中很少需要用到互联网。一旦无法接受信用卡支付,数字生产设施就会瘫痪,在线预订也无法处理,商业活动就会崩溃。
数字基础设施的寡头垄断
云基础设施集中在少数几家供应商手中的程度,在十年前,即使是最挑剔的观察家也难以想象。亚马逊网络服务(AWS)控制着全球云基础设施市场29%至30%的份额,微软Azure占20%,谷歌云占13%。这三家美国公司合计占据了全球云市场63%的份额,该市场在2025年第二季度达到了990亿美元的规模。预计到2025年全年,云市场收入将首次突破4000亿美元。
剩余的37%市场份额被众多规模较小的供应商瓜分,没有一家供应商的市场份额超过4%。阿里云约占4%,Oracle占3%,Salesforce和IBM Cloud各占2%。欧洲最大的云服务提供商OVHcloud的年收入约为30亿欧元,不到AWS收入的3%。
在内容分发网络 (CDN) 领域,这种集中度更为极端。所有依赖 CDN 的网站中,有 79.9% 使用 Cloudflare。三大 CDN 提供商合计占据了该市场 89% 的客户份额。Cloudflare 目前运营着一个遍布 100 多个国家/地区的 330 多个数据中心的网络,每秒处理超过 4600 万个 HTTP 请求。这些数据揭示了一个简单的道理:Cloudflare 的任何举动都会影响整个互联网。
市场集中度并非历史的偶然产物,而是市场固有动态的必然结果。云计算展现出若干有利于自然寡头垄断的结构性特征。运营全球数据中心网络需要数十亿美元的投资,涵盖基础设施、能源、冷却、网络容量和技术人员等方面。亚马逊每年在其云基础设施上投资超过600亿美元,微软超过400亿美元。如此巨大的投资规模构筑了几乎无法逾越的准入壁垒。
去中心化架构的错觉
互联网最初的设计理念是构建一个去中心化、冗余且因此具有内在弹性的网络。1960年,保罗·巴兰提出基于数据包的数据传输的开创性概念时,其背后的军事战略考量是创建一个没有单点故障的网络。ARPANET的愿景基于分布式架构原则:每个节点都应能够自主运行,数据包应自行找到在网络中的传输路径,并且单个组件的故障不应影响整个系统。
如今的现实与这一原则截然相反。如果某个AWS区域宕机,全球分布式服务就会崩溃。如果Cloudflare发生内部故障,数百万个网站将无法访问。大多数公司并未意识到许多看似独立的服务对同一底层基础设施提供商的传递依赖性。众多软件即服务(SaaS)提供商将其解决方案托管在AWS或Azure上。如果这些平台出现故障,即使公司名义上使用多个提供商,整个服务链也会崩溃。
2025年10月的AWS宕机事件便是这一现象的典型例证。受影响的不仅是亚马逊自身的Alexa和Prime Video等服务,还有数百个看似独立的SaaS应用程序:例如Jira和Confluence等协作工具、Canva等设计平台以及Signal等通讯服务。这些隐藏的依赖关系使得真正的冗余成为一项复杂的挑战,远非简单地使用多个服务提供商就能解决的。
我们在业务开发、销售和营销方面的全球行业和经济专业知识
行业重点:B2B、数字化(从AI到XR)、机械工程、物流、可再生能源和工业
更多相关信息请点击这里:
具有见解和专业知识的主题中心:
- 全球和区域经济、创新和行业特定趋势的知识平台
- 收集我们重点领域的分析、推动力和背景信息
- 提供有关当前商业和技术发展的专业知识和信息的地方
- 为想要了解市场、数字化和行业创新的公司提供主题中心
数字主权面临风险:美国云巨头如何主导欧洲基础设施
欧洲数字主权正处于十字路口
反复发生的网络中断引发了一场关于数字主权的辩论,其影响远远超出了纯粹的技术层面。三家美国公司实际上控制着欧洲的数字基础设施,这一事实引发了关于独立性的根本性质疑。超过90%的斯堪的纳维亚公司依赖美国的云服务,在英国,94%的科技公司使用美国的技术栈,甚至银行业和能源等关键行业也超过90%依赖于美国供应商。
国际刑事法院的案例生动地展现了这种依赖关系的地缘政治影响。2025年5月,在美国政府对国际刑事法院实施制裁后,微软封锁了首席检察官卡里姆·汗的电子邮件账户。由于依赖美国供应商,该机构实际上失去了对其数字通信基础设施的控制权。随后,国际刑事法院决定完全转向开源解决方案。
欧洲对这种依赖性的回应体现在诸如Gaia-X之类的项目中。该项目于2019年启动,旨在为欧洲打造高性能且具有竞争力的数据基础设施。然而,到了2025年春季,人们开始怀疑该项目的目标是否能够实现。Scaleway首席执行官Yann Lechelle以美国大型IT公司的阻挠为由,解释了他退出该项目的原因。他声称,这些公司通过拖延来阻碍和破坏任何向厂商中立、可移植模式迈进的进程。2025年2月,Nextcloud宣布退出Gaia-X项目之际,Frank Karlitschek宣布该项目已死,并表示建立欧洲云替代方案的最初目标已不再被讨论。同月,《法兰克福汇报》也撰文指出,Gaia-X项目已被视为失败,理由是其内部碎片化严重、官僚主义盛行以及利益冲突。
78%的德国企业认为他们对美国云服务提供商的依赖程度过高,而82%的企业更倾向于选择能够与AWS、Azure和谷歌云竞争的欧洲超大规模云服务提供商。与此同时,53%的云用户感到受制于服务提供商,51%的用户预计成本将会上涨。这些数据反映了一个根本性的困境:对许多企业而言,使用云服务的经济优势毋庸置疑,但这种依赖所带来的战略风险也日益凸显。
适合:
接连不断的失败
2025年,一系列令人担忧的基础设施故障接踵而至。就在11月Cloudflare灾难发生前四周,亚马逊网络服务(AWS)的一次故障导致全球超过7万家企业瘫痪。Signal、Snapchat、Fortnite、Canva以及众多其他服务中断数小时。故障原因是位于美国东部1区(US-EAST-1)的亚马逊DynamoDB服务器出现DNS问题,该服务器是美国云环境中最关键的基础设施节点之一。超过80项AWS服务同时瘫痪,引发连锁反应,残酷地暴露了高度互联系统的脆弱性。
2025年7月14日,Cloudflare服务拓扑的配置变更导致其DNS解析器1.1.1.1中断,持续62分钟。英国竞争与市场管理局(CMA)于2025年认定,微软和AWS合计控制了英国60%至80%的云市场,并滥用其市场支配地位。2025年10月29日,微软Azure服务中断,造成约160亿美元的损失,并严重影响了阿拉斯加航空、夏威夷航空等航空公司以及超市、咖啡店和互联网服务提供商的运营。
系统故障的频率和严重程度丝毫没有下降的迹象;相反,随着对云基础设施依赖性的日益增强,潜在的损失范围也在不断扩大。Uptime Institute 的研究表明,55% 的公司在过去三年中至少经历过一次重大 IT 系统故障,其中 10% 的故障造成了严重或灾难性的后果。社会正面临着一个令人不安的现实:下一次重大系统故障即将到来;问题不在于是否会发生,而在于何时发生。
摆脱数字脆弱性的方法
认识到这一漏洞后,关于应对措施的讨论日益增多。多云策略正被越来越多地推广为最佳实践。其背后的理念很简单:通过将工作负载分布在多个云提供商上,企业可以降低对单一提供商的依赖,并将服务中断的风险降至最低。采用多云策略的企业在发生服务中断时具有更强的恢复能力,因为它们可以将关键应用程序切换到其他提供商。
然而,多云策略的实际实施既复杂又成本高昂。不同的云服务提供商使用专有 API、不同的架构概念以及不兼容的管理工具。在云平台之间迁移工作负载通常需要对应用程序架构进行重大调整。Docker 和 Kubernetes 等容器技术理论上提供了独立于供应商的抽象层,但云服务提供商提供的专有扩展和托管服务又进一步限制了可移植性。
对于个体在线零售商或网站运营者而言,还有更务实的解决方案。Cloudflare 允许配置自定义错误页面,并在页面上显示支持电话号码或联系方式。如果当时设置了紧急订单热线,或许能在 11 月的系统宕机期间挽回一些损失。那些维护着精简版备用网站的商家,如果该网站未使用 Cloudflare,只保留基本功能且不依赖外部支付系统,则可以在几分钟内完成切换。
CDN市场本身正经历快速增长。全球内容分发网络市场预计将从2025年的278亿美元增长到2034年的792亿美元以上,复合年增长率(CAGR)高达12.3%。虽然这种扩张理论上可能为更多竞争和多元化创造空间,但现有超大规模数据中心运营商的结构性优势使得真正的市场碎片化不太可能发生。
网络效率悖论
经济效率与系统韧性之间的根本矛盾贯穿了围绕云基础设施的整个讨论。集中式系统效率更高、成本效益更好,性能也更优。分散式系统更具韧性、更稳健、更独立,但管理成本更高、更复杂。这种权衡取舍至关重要,难以轻易解决。
然而,近期发生的故障表明,效率至上的理念已经矫枉过正。忽视冗余和弹性会造成成本,而这些成本往往未被充分纳入考量。62%的德国企业表示,如果没有云服务,他们的业务将彻底瘫痪。这种依赖性并非局限于特定行业:金融、医疗保健、能源和电信等关键基础设施、电子商务、物流,甚至政府机构都从根本上依赖于云服务的可用性。
Cloudflare自身持续快速增长。2025年第三季度,该公司营收达5.62亿美元,同比增长30%。预计2025年全年营收将超过20亿美元。年消费额超过100万美元的客户数量增至173家,同比增长47%。这些数据表明,尽管存在显而易见的风险,但市场集中度仍在持续上升。
2025年秋季AWS和Cloudflare的服务中断应该被视为一次警钟。这并非不幸的运营事故,而是系统性脆弱基础设施亟需调整的征兆。早期互联网的去中心化愿景已被效率和规模经济取代韧性和冗余的经济现实所取代。其结果是,一旦出现局部故障,就会造成全球范围内的连锁反应。这种脆弱性带来的代价——直接的经济损失、生产力下降、声誉损害以及长期的战略风险——加起来构成了巨大的经济负担,而公众才刚刚开始意识到其全部影响。
欧盟/德国数据安全 | 集成独立、跨数据源的AI平台,满足所有业务需求
Ki-Gamechanger:最灵活的AI平台销售解决方案,降低成本,提高决策并提高效率
独立的AI平台:集成所有相关的公司数据源
- 快速AI集成:在数小时或数月内为公司量身定制的AI解决方案
- 灵活的基础架构:基于云或在您自己的数据中心(德国,欧洲,免费位置选择)的托管
- 最高数据安全:在律师事务所使用是安全的证据
- 在各种公司数据源中使用
- 选择您自己或各种AI模型(DE,欧盟,美国,CN)
更多相关信息请点击这里:
建议 - 计划 - 实施
🎯🎯🎯 受益于 Xpert.Digital 全面的五重专业知识和全面的服务包 | BD、研发、XR、PR 和数字可视性优化
Xpert.Digital 对各个行业都有深入的了解。 这使我们能够制定量身定制的策略,专门针对您特定细分市场的要求和挑战。 通过不断分析市场趋势并跟踪行业发展,我们可以前瞻性地采取行动并提供创新的解决方案。 通过经验和知识的结合,我们创造附加值并为客户提供决定性的竞争优势。
更多相关信息请点击这里:






























