人工智能的巨大幻觉与开发者的无声反抗：当人工智能成为负担——压力更大，代码运行更慢

Konrad Wolfenstein

3个月前

人工智能的巨大幻觉与开发者的无声反抗：当人工智能成为负担——压力更大，代码运行更慢——图片来源：Xpert.Digital

软件开发中人工智能的残酷真相：“Vibe Coding”灾难——人工智能工具如何悄然制造一颗价值万亿美元的定时炸弹

一项研究震惊董事会：人工智能让程序员的工作效率降低，而不是加快。

危险的炒作：为什么 66% 的开发者现在不信任人工智能生成的代码

在董事会上，人工智能在软件开发领域被誉为生产力的终极奇迹。然而，在令人振奋的董事会报告背后，开发团队内部正酝酿着一场悄无声息的反抗。人工智能工具非但没有简化日常工作，反而日益成为浪费脑力的罪魁祸首。当前的研究和令人担忧的现实报告揭示了一个令人不安的事实：人工智能生成的代码通常“几乎正确”，但却需要极其耗时且繁琐的调试。结果呢？开发时间延长，认知负荷急剧上升，企业在不知不觉中积累了难以偿还的技术债务。所谓的“直觉编码”（即人工智能不假思索地生成代码）有可能成为一颗价值万亿美元的定时炸弹。是时候正视软件开发的现实了，而管理层往往对此视而不见。.

生产力奇迹还是倦怠陷阱？人工智能在软件开发领域中，高管们不愿听到的真相。

管理层和开发团队之间存在着巨大的误解

在近期的科技发展中，鲜有哪项能像人工智能在软件开发领域的应用那样，在全球企业领导者中引发如此巨大的热情。董事会会议、投资者报告和战略文件中充斥着“生产力倍增器”、“竞争优势”和“变革性效率”等词汇。然而，尽管高管们将人工智能驱动的编码工具奉为万灵药，但全球各地的开发部门却正经历着截然不同的体验——挫败感、精神疲惫和日益增长的怀疑。.

预期与现实之间的这种差距并非边缘现象，也不是缺乏适应能力的表现。这是一个结构性问题，从中长期来看，它将给企业带来高昂的成本。问题不再是软件开发中是否应该使用人工智能工具——事实上，84%的开发部门已经这样做了——而是如何以及在何种条件下才能使其可持续地发挥作用。对现有数据、研究和案例的冷静分析表明，实际情况远比目前流行的进步叙事所描绘的要复杂得多。.

当热情遭遇阻力：实践中的张力

Stack Overflow 2025 年开发者调查是同类调查中最全面的，涵盖了来自 177 个国家/地区的 49,000 多名开发者，其结果令人警醒。尽管人工智能工具的采用率逐年增长，从 76% 增至 84%，且 51% 的专业开发者每天都在使用这些工具，但开发者对这些工具的积极态度却在同一时期急剧下降：从 2023 年和 2024 年的 70% 以上降至 2025 年的 60%。信任度问题尤其发人深省：仅有 33% 的开发者信任人工智能输出的准确性（低于前一年的 43%），而 46% 的开发者则持怀疑态度，只有 3% 的开发者表示“非常信任”人工智能的结果。.

经验丰富的开发者往往最为怀疑：只有 2.6% 的开发者表示他们非常信任人工智能的输出结果，而 20% 的开发者则明确表示对人工智能生成的结果强烈不信任。这并非巧合。那些多年来设计复杂系统、追踪嵌套深层代码库中的漏洞、并亲身经历过短视架构决策带来的长期后果的人，会对看似简单的解决方案产生一种根深蒂固的怀疑态度——而且这种怀疑态度并非出于倒退，而是有理性依据的。.

快速生成的代码具有欺骗性。

66%的开发者认为，人工智能解决方案“几乎正确，但总有不足”是他们面临的最大难题，也是最令人沮丧的根源。这种现象的经济后果比表面看起来更为严重。90%正确的代码并不能创造90%的附加值——它甚至可能根本没有任何价值，因为在部署到生产系统之前，必须先进行全面的测试、修正和调整。45%的受访开发者证实，调试人工智能生成的代码比从头编写相同的代码花费更多时间。.

由此产生的一个后果是，提交到代码仓库的所有代码变更中有 42% 都由人工智能辅助完成，但开发人员花费在审查这些变更上的时间却比编写原始代码的时间还要多。实际上，这意味着虽然人工智能加快了代码生成速度，但却减缓了高质量且易于维护的代码的生成速度。在这种情况下，原本用于提高生产力的工具却变成了一种极其耗时的控制机制。.

数字真正揭示了生产力的哪些信息

近期研究中最令人不安的发现或许来自独立研究机构METR于2025年2月至6月开展的一项随机对照试验（RCT）。16位经验丰富的开源开发者分别在有无人工智能工具（例如Cursor Pro和Claude 3.5/3.7 Sonnet）的情况下，处理了他们各自长期项目中的246项任务。结果与所有参与者的预期截然相反：在研究开始前，开发者们估计人工智能支持可以将处理时间缩短24%；而实际上，人工智能工具反而使处理时间增加了19%。.

这一发现不仅与相关开发人员的评估相悖，也与商业和机器学习专家的预测相矛盾，后者曾预测可节省 38% 至 39% 的时间。研究人员指出，编写提示、审查 AI 输出以及管理工具集成都需要耗费大量时间，这可能是造成这一结果的原因。此外，成熟的代码库具有严格的质量标准——这在专业企业环境中很常见——尤其不适合使用基于通用代码示例训练的 AI 工具。这项研究并非彻底否定 AI 工具，而是清楚地表明，对于成熟代码库中复杂且依赖于上下文的任务而言，生产力提升远非必然。.

无形的负担：精神疲惫和认知超负荷

除了可量化的时间成本之外，还有一个更难以量化但同样真实的负担：不断在编写人工智能提示、分析生成结果、故障排除和文档编写之间切换所带来的精神疲惫。开发者们形容这种状态尤其令人精疲力竭，因为它不像编程中经典的“心流”体验那样允许深度专注的工作阶段，而是迫使他们进入一种碎片化的注意力模式。认知科学已经证实，这种碎片化的注意力模式尤其令人疲惫，并且从长远来看会导致绩效下降。.

咨询公司 Thoughtworks 在其 2026 年 4 月发布的第 34 期《技术雷达》报告中，为这种现象创造了一个贴切的术语：“认知债务”。它指的是代码实际功能与开发者对其理解之间日益扩大的差距。随着每一个未经充分理解就被采用的自动生成的代码块，这种差距都在悄然扩大，但其后果却影响深远。Thoughtworks 首席技术官 Rachel Laycock 精辟地总结了这一发现：人工智能代理虽然能够加快代码编写速度，但却越来越难以满足开发者的理解需求。.

架构盲点：人工智能代码系统性地犯哪些错误

Ox Security 于 2025 年 10 月进行的一项深入分析，考察了 300 个开源项目（其中 50 个项目全部或部分由人工智能生成），并识别出人工智能生成代码中十种反复出现的反模式。最常见的问题可以用一句话概括：人工智能生成的代码“功能性很强，但系统性地缺乏架构判断”。在 80% 到 90% 的情况下，人工智能倾向于实现教科书式的解决方案，而不是针对应用程序的具体需求，避免重构，并且由于模型不保留任何先前实现的记忆，因此会反复犯同样的功能性错误。.

研究员Ana Bildea称之为“代码生成膨胀”的现象尤其令人担忧：由于人工智能并非开发库，而是反复生成内联功能，导致代码库不受控制地增长，包含大量冗余代码块，维护难度也日益增加。Bildea精辟地描述了这种动态：她观察到一些公司在不到18个月的时间里，就从“人工智能正在加速我们的开发”变成了“我们无法再交付新功能，因为我们不再理解自己的系统”。GitClear的数据进一步证实了这一点：2021年至2024年间，与重构相关的代码变更比例从25%下降到10%以下，而复制代码块的比例则从8.3%上升到12.3%。.

🎯🎯🎯 数据驱动的 B2B 行业中心，作为一种准内部解决方案

准内部解决方案：Xpert.Digital 如何弥合 B2B 营销和销售中的运营差距——智能内容驱动型业务——图片：Xpert.Digital

Xpert.Digital 是一个以数据驱动的 B2B 行业中心，由 Konrad Wolfenstein 领导。该公司为工业合作伙伴提供外部的、准内部解决方案，弥补其在市场营销、内容和销售方面的运营缺口，而无需客户投入额外资源。.

更多信息请点击这里：

准内部解决方案：Xpert.Digital 如何弥合 B2B 营销和销售中的运营差距——智能内容驱动型业务

负责任的人工智能：防止技术债务不断增长的四条规则

人工智能时代的科技债务：一颗价值万亿美元的定时炸弹

技术债务现象在软件行业并不新鲜，但人工智能的广泛应用正使其规模和速度都发生了变化。当短期、务实的解决方案优先于长期、稳定的架构时，技术债务就会产生。据HFS Research的数据显示，全球最大的2000家企业累计的技术债务已高达1.5万亿至2万亿美元。而如今，在未经充分验证的人工智能生成代码库的影响下，这一负担可能呈指数级增长。.

IBM 的分析显示，81% 的高管表示，技术债务已经限制了其人工智能项目的成功。这是一个惊人的悖论：旨在减少技术债务的技术，在某些情况下反而会产生新的债务。GitLab 在其《2025/2026 年全球 DevSecOps 报告》中计算得出，与人工智能相关的效率低下平均每周会给开发团队的每个成员造成 7 小时的损失——几乎相当于一个完整的工作日。与此同时，73% 的受访 DevSecOps 专业人员表示，他们在使用“直觉编码”（vibe coding）生成的代码时遇到了问题。“直觉编码”是指在不理解底层逻辑的情况下，根据自然语言提示生成代码。这个术语最初源于创业领域，如今已成为缺乏充分质量控制的创业冒险的代名词。.

氛围编码灾难：速度吞噬质量

直觉式编码——即在缺乏架构规划和最佳实践基础的情况下，利用人工智能提示凭直觉生成代码——或许最能体现人工智能的狂热与工程现实之间的巨大鸿沟。事实上，在 Stack Overflow 的调查中，72% 的受访开发者明确反对直觉式编码，另有 5% 的开发者认为它是其工作流程中完全无法接受的部分。然而，依赖直觉式编码的公司为此付出了沉重的代价：据 Thoughtworks 的数据显示，即使代码变更之前已经通过了所有自动化测试，仍有 43% 的人工智能生成的代码变更需要在生产环境中进行手动调试。该研究中，没有一家公司能够仅通过一次重新部署就验证人工智能建议的修复方案——88% 的公司需要两到三次部署，11% 的公司甚至需要四次或更多次部署。.

经济后果十分严重。CAST Software 分析了超过 100 亿行代码，计算得出全球技术债务相当于 610 亿个工作日的修复工作量。这还是保守估计，并未计入过去两年人工智能代码不受控制的使用所导致的债务加速累积。如果这种技术债务带来的经济损失超过了预期的生产力提升——许多经验丰富的开发人员认为这种情况即将发生——那么整个行业在自身的转型叙事中将面临根本性的信誉危机。.

经验者的反抗：当能力成为一种负担

尤其令人担忧的是，新一代开发人员的技能正在逐渐下降。经验丰富的开发人员担心，那些从职业生涯初期就主要使用人工智能工具的初级开发人员，将无法识别生成代码中的根本性错误——因为他们一开始就没有培养必要的理论基础和分析判断能力。Thoughtworks 在新员工入职培训的背景下，恰如其分地描述了这个问题：当新团队成员接手一个代码库，其中很大一部分代码是由人工智能代理生成的，那么人类逐行编写代码时产生的隐式文档就缺失了。架构决策还在，但背后的逻辑却缺失了。.

与此同时，经验丰富的开发者正经历着一种奇特的贬值。那些多年来培养出精准判断力、系统性问题解决能力和架构远见的开发者，如今却要与那些能够使用代码助手的新手，在以人工智能采用率作为绩效指标的环境中，用同样的标准来衡量自身能力。GitLab 的悖论完美地诠释了这一点：82% 的公司现在每周至少部署一次生产环境，但只有 37% 的公司愿意信任人工智能，让它在无需人工审核的情况下执行日常任务。速度更快，信任度更低——这就是当前形势的本质。.

人工智能控制的关键问题：如何衡量性能？

在人工智能时代，评估开发人员绩效的标准并非无关紧要的人力资源争论，而是一项具有战略意义的关键决策。如果公司将人工智能使用率作为绩效指标，就会产生扭曲的激励机制：开发人员为了完成指标而最大化地使用人工智能，而不是为了创造更好的产品——这必然会导致代码质量下降。这一点得到了开发人员的一致认同：那些仅仅为了完成内部指标而使用人工智能代码的人，不仅无法创造任何附加价值，反而会积累技术债务。.

Gartner预测，到2027年，衡量开发者绩效的方式将从速度指标、部署频率和代码行数等传统指标，转向创造力、创新和商业价值。这一预测在理论上是合理的，但只要高管们继续追求短期生产力提升，实践中就难以落实。Stack Overflow面向高管的分析指出，开发者对人工智能信心的下降直接源于两个主要方面的挫败感：“几乎正确”的解决方案以及调试人工智能代码所浪费的时间。然而，社区信任仍然至关重要：80%的开发者仍然定期访问Stack Overflow，而且自2023年以来，该平台上复杂问题的数量翻了一番——这清楚地表明了人工智能辅助的局限性。.

在软件开发中负责任地使用人工智能意味着什么

上述发现并非支持对软件开发中人工智能工具的全面否定，而是为负责任地使用人工智能工具指明了方向。首先，人工智能必须部署在其特定功能真正适用的领域：例如，用于定义明确、不依赖于具体上下文的独立任务，如原型开发、文档编写、样板代码生成，或作为解决常见问题的快速信息接口。人工智能并非万能的代码生成器，而是一种具有明确优势和劣势的专业辅助工具。.

第二，需要专门针对人工智能生成的代码设计完善的代码审查流程。Thoughtworks 强烈建议不仅不要降低，反而要加强审查的严格程度和频率——正是因为机器编写代码的速度比人类阅读的速度快。第三，必须对年轻开发人员进行结构化的培训，确保他们的基本技能不会被视为过时，而是成为熟练使用人工智能工具的必要基础。不了解优秀代码构成的人无法纠正糟糕的人工智能代码。第四，公司应该严格地将性能指标与人工智能的使用率脱钩——因为系统的质量并非取决于所使用的人工智能技术，而是取决于开发过程中所体现的工程判断。.

该行业的觉醒时刻尚未到来。

许多经验丰富的开发者都提出了一个令人警醒的预测：一旦人工智能生成代码所累积的技术债务造成的经济损失显著超过其所宣称的生产力提升，整个行业将会迎来一次集体的“警钟”。鉴于现有数据——高达2万亿美元的技术债务、每位开发者每周因人工智能相关低效而损失7小时的生产力，以及43%的人工智能代码需要人工实时调试——这一刻或许比高管们那些光鲜亮丽、乐观的人工智能演示所暗示的要来得更近。.

关键的转折点不在于技术本身。人工智能工具的功能日益强大，METR在其后续研究设计中也已承认，虽然新工具可能带来积极的生产力提升，但由于开发者行为的改变，衡量这些提升将变得更加困难。真正的挑战在于组织和文化层面：企业必须有勇气区分人工智能供应商的承诺、投资者的期望以及来自自身开发者的基于实证的反馈。一项大多数日常使用者都不信任的技术，并非战略优势，而是一种风险，这种风险将在未来数年内持续反映在企业的资产负债表上。.

您的全球营销和业务拓展合作伙伴

☑️ 我们的业务语言是英语或德语。

☑️ 新增：用您的母语进行通信！

Konrad Wolfenstein

我和我的团队很乐意为您提供私人顾问服务。.

您可以通过填写此处的联系表格联系我wolfenstein@xpert.digital：，或者直接致电+49 7348 4088 965。我的邮箱地址是

人工智能的巨大幻觉与开发者的无声反抗：当人工智能成为负担——压力更大，代码运行更慢

软件开发中人工智能的残酷真相：“Vibe Coding”灾难——人工智能工具如何悄然制造一颗价值万亿美元的定时炸弹

一项研究震惊董事会：人工智能让程序员的工作效率降低，而不是加快。

生产力奇迹还是倦怠陷阱？人工智能在软件开发领域中，高管们不愿听到的真相。

当热情遭遇阻力：实践中的张力

快速生成的代码具有欺骗性。

数字真正揭示了生产力的哪些信息

无形的负担：精神疲惫和认知超负荷

架构盲点：人工智能代码系统性地犯哪些错误

🎯🎯🎯 数据驱动的 B2B 行业中心，作为一种准内部解决方案

负责任的人工智能：防止技术债务不断增长的四条规则

人工智能时代的科技债务：一颗价值万亿美元的定时炸弹

氛围编码灾难：速度吞噬质量

经验者的反抗：当能力成为一种负担

人工智能控制的关键问题：如何衡量性能？

在软件开发中负责任地使用人工智能意味着什么

该行业的觉醒时刻尚未到来。

您的全球营销和业务拓展合作伙伴

☑️ 我们的业务语言是英语或德语。

☑️ 新增：用您的母语进行通信！

☑️ 为中小企业提供战略、咨询、规划和实施方面的支持

☑️ 制定或调整数字化战略和数字化

☑️ 拓展和优化国际销售流程

☑️ 全球及数字化 B2B 交易平台

☑️ 先锋业务拓展/市场营销/公关/展会

软件开发中人工智能的残酷真相：“Vibe Coding”灾难——人工智能工具如何悄然制造一颗价值万亿美元的定时炸弹

一项研究震惊董事会：人工智能让程序员的工作效率降低，而不是加快。

生产力奇迹还是倦怠陷阱？人工智能在软件开发领域中，高管们不愿听到的真相。

当热情遭遇阻力：实践中的张力

快速生成的代码具有欺骗性。

数字真正揭示了生产力的哪些信息

无形的负担：精神疲惫和认知超负荷

架构盲点：人工智能代码系统性地犯哪些错误

🎯🎯🎯 数据驱动的 B2B 行业中心，作为一种准内部解决方案

负责任的人工智能：防止技术债务不断增长的四条规则

人工智能时代的科技债务：一颗价值万亿美元的定时炸弹

氛围编码灾难：速度吞噬质量

经验者的反抗：当能力成为一种负担

人工智能控制的关键问题：如何衡量性能？

在软件开发中负责任地使用人工智能意味着什么

该行业的觉醒时刻尚未到来。

您的全球营销和业务拓展合作伙伴

☑️ 我们的业务语言是英语或德语。

☑️ 新增：用您的母语进行通信！

☑️ 为中小企业提供战略、咨询、规划和实施方面的支持

☑️ 制定或调整数字化战略和数字化

☑️ 拓展和优化国际销售流程

☑️ 全球及数字化 B2B 交易平台

☑️ 先锋业务拓展/市场营销/公关/展会

其他主题