Available in 27 languages 📢

谁是人工智能先驱？对深度学习革命的全面分析

发布日期：2025年8月2日 / 更新日期：2025年8月2日 – 作者：Konrad Wolfenstein

谁是人工智能先驱？深度学习革命的全面分析——图片来源：Xpert.Digital

别再关注 ChatGPT 了：谷歌 2017 年发表的论文《注意力就是一切》才是人工智能爆发的真正原因。

深度学习时代指的是什么？

深度学习时代指的是自2010年以来，人工智能发展因多项技术突破而突飞猛进的时期。这一时期标志着人工智能发展史上的一个转折点，因为训练复杂神经网络的必要前提条件首次齐备：充足的计算能力、庞大的数据集和改进的算法。

深度学习指的是能够自动从数据中提取抽象特征的多层神经网络。与以往的方法不同，这些系统不再需要手动编程来识别特定特征；相反，它们可以从训练数据中独立学习这些模式。

适合：

人工智能模型简明解释：了解人工智能、语言模型和推理的基础知识

为什么深度学习革命始于 2010 年？

2010年是具有里程碑意义的一年，三大关键发展汇聚于此。首先，ImageNet数据库发布，其中包含超过1000万张标注图像，涵盖1000个类别，从而首次提供了足够大的数据集来训练深度神经网络。

其次，图形处理器（GPU）的性能已经足够强大，可以并行处理大量数据。NVIDIA 于 2007 年推出的 CUDA 平台，使研究人员能够执行深度学习所需的密集计算。

第三，算法的改进，特别是使用 ReLU 激活函数代替传统的 sigmoid 函数，显著加快了训练速度。这种进步最终使得将 20 世纪 80 年代的理论基础付诸实践成为可能。

深度学习革命的开端标志着哪项突破？

决定性的突破发生在2012年9月30日，AlexNet在ImageNet竞赛中获胜。这款由Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton开发的卷积神经网络，其前五名错误率仅为15.3%，比第二名算法低了10多个百分点。

AlexNet是深度神经网络、大型数据集和GPU计算首次成功结合的案例。值得一提的是，它的训练仅在克里热夫斯基卧室里的两张NVIDIA显卡上完成。这一成功向科学界证明，深度学习不仅在理论上引人入胜，而且在实践中也具有显著优势。

AlexNet 的成功引发了一系列后续发展。早在 2015 年，SENet 模型就以 2.25% 的错误率超越了 ImageNet 的人类识别率。短短几年内取得如此显著的进步，充分展现了深度学习技术的巨大潜力。

Transformer架构发挥了什么作用？

2017年，谷歌团队发表了具有里程碑意义的论文《注意力机制就是你所需要的一切》，其中提出了Transformer架构。该架构完全依赖于注意力机制，无需循环神经网络，从而彻底革新了自然语言处理。

Transformer 模型的独特之处在于其并行处理能力：早期的模型只能逐词顺序处理，而 Transformer 可以同时处理整个句子。其自注意力机制使模型能够理解句子中所有词语之间的关系，而无需考虑它们的位置。

从 BERT 和 GPT 到 Gemini，Transformer 架构成为了所有现代主流语言模型的基础。截至 2025 年，该论文的引用次数已超过 17.3 万次，被认为是 21 世纪最具影响力的科学著作之一。

为什么谷歌是人工智能领域的领先先驱？

根据Epoch AI的分析，谷歌以168个“重要”人工智能模型遥遥领先于其他领域。这种主导地位可以归因于该公司早期做出的几项战略决策。

早在2000年代，谷歌就大力投资人工智能研究，并很早就认识到神经网络的潜力。2014年收购DeepMind为公司带来了更多专业技术。至关重要的是，2015年TensorFlow框架的开源发布加速了全球人工智能的发展。

谷歌对Transformer架构的贡献尤为显著。谷歌研究人员于2017年发表的论文为当今的生成式人工智能奠定了基础。在此基础上，谷歌开发了BERT（2018），彻底革新了自然语言处理，随后又推出了Gemini模型。

谷歌研发与产品开发的紧密结合进一步提升了其知名度。人工智能模型直接集成到谷歌的各项服务中，例如搜索、YouTube 和安卓系统，这有助于其实际应用，也因此成为“值得关注”模型的重要评判标准。

适合：

AI 和 SEO with BERT – 来自 Transformers 的双向编码器表示 – 自然语言处理 (NLP) 领域的模型

微软、OpenAI 和 Meta 是如何发展起来的？

微软以 43 个值得关注的 AI 模型位居第二。该公司受益于与 OpenAI 的战略合作，微软为此投入了数十亿美元。这项合作使微软能够尽早将 GPT 模型集成到 Bing 和 Copilot 等产品中。

OpenAI 拥有 40 个模型，尽管成立于 2015 年，却位列第三。从 GPT-1（2018 年）到目前的 GPT-4 和 o3 等模型，GPT 系列的发展使 OpenAI 成为大型语言模型领域的领先开发商。2022 年发布的 ChatGPT 在短短五天内就吸引了百万用户，让人工智能走进了大众视野。

Meta（Facebook旗下公司）开发了LLaMA系列模型，包含35个型号，作为专有模型的开源替代方案。LLaMA模型，尤其是LLaMA 3和最新的LLaMA 4，证明了开源模型可以与专有解决方案相媲美。

适合：

截至2024年9月：人工智能模型数量概览：排名前15位的主要语言模型 – 149个基础模型 – 51个机器学习模型

什么因素会让一个人工智能模型“引人注目”？

Epoch AI 将符合以下四个标准之一的 AI 模型定义为“值得关注”。首先，它必须在技术上优于公认的基准模型。其次，它的引用率应超过 1000 次。第三，即使模型在技术上已经过时，其历史相关性也可以作为评判标准之一。第四，模型必须具有显著的实际应用价值。

这个定义不仅关注技术进步，还关注其在科学和经济领域的实际影响和相关性。因此，即使一个模型并非技术最先进的，但如果它能得到广泛的实际应用，也可以被认为是值得关注的。

Epoch AI 数据库收录了从 1950 年至今的 2400 多个机器学习模型，是目前公开可用的同类数据集中规模最大的。这一全面的数据集为深入分析 70 多年来人工智能的发展提供了坚实的基础。

在深度学习时代之前，人工智能是如何发展的？

2010年以前的人工智能发展史充满了乐观与失望的循环。20世纪50年代和60年代，人们普遍抱有极大的乐观情绪，弗兰克·罗森布拉特于1957年发明的感知器便是这种乐观情绪的象征。这些早期的神经网络使人们对人工智能的到来充满希望。

第一次人工智能寒冬始于20世纪70年代初，其导火索是马文·明斯基和西摩·帕普特于1969年出版的关于感知器局限性的著作。1973年英国议会发布的莱特希尔报告导致研究经费大幅削减。这一时期持续到1980年左右，严重阻碍了人工智能研究的发展。

20世纪80年代，随着MYCIN（一种医疗诊断系统）等专家系统的出现，神经网络迎来了复苏。与此同时，1986年，杰弗里·辛顿、大卫·鲁梅尔哈特和罗纳德·威廉姆斯开发了反向传播算法，使神经网络能够进行训练。早在1989年，扬·勒昆就开发了LeNet，这是一种用于手写识别的早期卷积神经网络。

第二次人工智能寒冬出现在20世纪80年代末，当时人们对专家系统和LISP机器寄予厚望，但最终却失望而归。这一阶段一直持续到90年代，其特点是对神经网络持怀疑态度。

深度学习背后的技术基础是什么？

深度学习革命的兴起离不开三项关键突破。高性能GPU的开发至关重要，因为它实现了海量数据的并行处理。NVIDIA于2007年推出的CUDA平台，使得机器学习能够利用GPU进行计算。

第二个必要条件是拥有庞大且高质量的数据集。ImageNet 由李飞飞于 2010 年发布，是首个提供超过 1000 万张带标签图像的数据集。如此庞大的数据量对于有效训练深度神经网络至关重要。

算法改进构成了第三个支柱。使用 ReLU 激活函数代替 sigmoid 函数显著加快了训练速度。改进的优化方法和正则化技术（例如 dropout）有助于解决过拟合问题。

人工智能训练的计算成本是如何发展的？

人工智能模型的训练成本呈指数级增长。2017年，最初的Transformer模型训练成本仅为930美元。2018年，BERT-Large的训练成本已达3300美元，而GPT-3在2020年的训练成本约为430万美元。

现代模型的成本更加惊人：GPT-4 的造价估计为 7840 万美元，而谷歌的 Gemini Ultra 造价约为 1.914 亿美元，可能是迄今为止训练成本最高的模型。这一趋势反映了模型复杂性和规模的不断增长。

据Epoch AI称，训练所需的计算能力大约每五个月翻一番。这一发展速度远远超过摩尔定律，表明人工智能研究正在迅速扩展。与此同时，这也导致人工智能研发集中在少数拥有必要资源的公司手中。

适合：

全球人工智能格局综合分析：人工智能现状（2025年7月）

人工智能的进一步发展面临哪些挑战？

人工智能发展面临诸多重大挑战。针对复杂逻辑思维优化的推理模型最早可能在2026年就达到其扩展极限。巨额的计算成本限制了能够参与前沿人工智能研究的人员数量。

诸如幻觉之类的技术问题，即人工智能系统生成虚假信息，尚未得到彻底解决。与此同时，生成具有欺骗性的真实内容的可能性也引发了伦理问题，例如那张教皇身穿羽绒服的AI图像就曾引起广泛关注。

高质量训练数据的可用性正日益成为瓶颈。许多模型已经使用大量可用的互联网数据进行训练，因此需要新的数据生成方法。

人工智能发展如何影响社会？

深度学习革命已经对社会产生了巨大的影响。人工智能系统正在医疗诊断、金融和自动驾驶汽车等关键领域得到应用。其带来的积极变革潜力巨大，涵盖了从加速科学发现到个性化教育等诸多方面。

与此同时，新的风险也随之而来。制造逼真虚假内容的能力威胁着信息完整性。自动化可能会危及就业，德国联邦劳动部预计，到2035年，任何工作都将离不开人工智能软件。

人工智能能力集中在少数科技公司手中，引发了人们对这项强大技术民主控制的质疑。深度学习先驱之一杰弗里·辛顿等专家已就未来人工智能系统的潜在危险发出警告。

深度学习时代的AI先驱们创造了一项具有从根本上改变人类的潜力的技术。谷歌在开发168个重要的AI模型方面处于领先地位，紧随其后的是微软、OpenAI和Meta，这表明创新力量集中在少数几家关键企业手中。深度学习革命始于2010年，由AlexNet和Transformer架构等突破性成果推动，它已经改变了我们的日常生活，未来还将产生更加深远的影响。挑战在于如何利用这项强大的技术造福人类，同时最大限度地降低其风险。

适合：

您的AI转换，AI集成和AI平台行业专家

☑️我们的业务语言是英语或德语

☑️ 新：用您的国家语言进行通信！

Konrad Wolfenstein

我很乐意作为个人顾问为您和我的团队提供服务。

您可以通过填写此处的联系表，或者直接致电+49 89 89 674 804 （慕尼黑）。我的电子邮件地址是： wolfenstein ∂ xpert.digital