Available in 27 languages 📢
Xpert.Digital bei Google bevorzugen

谁是人工智能先驱?对深度学习革命的全面分析

发布日期:2025年8月2日 / 更新日期:2025年8月2日 – 作者:Konrad Wolfenstein

谁是人工智能先驱?对深度学习革命的全面分析

谁是人工智能先驱?深度学习革命的全面分析——图片来源:Xpert.Digital

别再关注 ChatGPT 了:谷歌 2017 年发表的论文《注意力就是一切》才是人工智能爆发的真正原因。

深度学习时代指的是什么?

深度学习时代指的是自2010年以来,人工智能发展因多项技术突破而突飞猛进的时期。这一时期标志着人工智能发展史上的一个转折点,因为训练复杂神经网络的必要前提条件首次齐备:充足的计算能力、庞大的数据集和改进的算法。

深度学习指的是能够自动从数据中提取抽象特征的多层神经网络。与以往的方法不同,这些系统不再需要手动编程来识别特定特征;相反,它们可以从训练数据中独立学习这些模式。

适合:

为什么深度学习革命始于 2010 年?

2010年是具有里程碑意义的一年,三大关键发展汇聚于此。首先,ImageNet数据库发布,其中包含超过1000万张标注图像,涵盖1000个类别,从而首次提供了足够大的数据集来训练深度神经网络。

其次,图形处理器(GPU)的性能已经足够强大,可以并行处理大量数据。NVIDIA 于 2007 年推出的 CUDA 平台,使研究人员能够执行深度学习所需的密集计算。

第三,算法的改进,特别是使用 ReLU 激活函数代替传统的 sigmoid 函数,显著加快了训练速度。这种进步最终使得将 20 世纪 80 年代的理论基础付诸实践成为可能。

深度学习革命的开端标志着哪项突破?

决定性的突破发生在2012年9月30日,AlexNet在ImageNet竞赛中获胜。这款由Alex Krizhevsky、Ilya Sutskever和Geoffrey Hinton开发的卷积神经网络,其前五名错误率仅为15.3%,比第二名算法低了10多个百分点。

AlexNet是深度神经网络、大型数据集和GPU计算首次成功结合的案例。值得一提的是,它的训练仅在克里热夫斯基卧室里的两张NVIDIA显卡上完成。这一成功向科学界证明,深度学习不仅在理论上引人入胜,而且在实践中也具有显著优势。

AlexNet 的成功引发了一系列后续发展。早在 2015 年,SENet 模型就以 2.25% 的错误率超越了 ImageNet 的人类识别率。短短几年内取得如此显著的进步,充分展现了深度学习技术的巨大潜力。

Transformer架构发挥了什么作用?

2017年,谷歌团队发表了具有里程碑意义的论文《注意力机制就是你所需要的一切》,其中提出了Transformer架构。该架构完全依赖于注意力机制,无需循环神经网络,从而彻底革新了自然语言处理。

Transformer 模型的独特之处在于其并行处理能力:早期的模型只能逐词顺序处理,而 Transformer 可以同时处理整个句子。其自注意力机制使模型能够理解句子中所有词语之间的关系,而无需考虑它们的位置。

从 BERT 和 GPT 到 Gemini,Transformer 架构成为了所有现代主流语言模型的基础。截至 2025 年,该论文的引用次数已超过 17.3 万次,被认为是 21 世纪最具影响力的科学著作之一。

为什么谷歌是人工智能领域的领先先驱?

根据Epoch AI的分析,谷歌以168个“重要”人工智能模型遥遥领先于其他领域。这种主导地位可以归因于该公司早期做出的几项战略决策。

早在2000年代,谷歌就大力投资人工智能研究,并很早就认识到神经网络的潜力。2014年收购DeepMind为公司带来了更多专业技术。至关重要的是,2015年TensorFlow框架的开源发布加速了全球人工智能的发展。

谷歌对Transformer架构的贡献尤为显著。谷歌研究人员于2017年发表的论文为当今的生成式人工智能奠定了基础。在此基础上,谷歌开发了BERT(2018),彻底革新了自然语言处理,随后又推出了Gemini模型。

谷歌研发与产品开发的紧密结合进一步提升了其知名度。人工智能模型直接集成到谷歌的各项服务中,例如搜索、YouTube 和安卓系统,这有助于其实际应用,也因此成为“值得关注”模型的重要评判标准。

适合:

微软、OpenAI 和 Meta 是如何发展起来的?

微软以 43 个值得关注的 AI 模型位居第二。该公司受益于与 OpenAI 的战略合作,微软为此投入了数十亿美元。这项合作使微软能够尽早将 GPT 模型集成到 Bing 和 Copilot 等产品中。

OpenAI 拥有 40 个模型,尽管成立于 2015 年,却位列第三。从 GPT-1(2018 年)到目前的 GPT-4 和 o3 等模型,GPT 系列的发展使 OpenAI 成为大型语言模型领域的领先开发商。2022 年发布的 ChatGPT 在短短五天内就吸引了百万用户,让人工智能走进了大众视野。

Meta(Facebook旗下公司)开发了LLaMA系列模型,包含35个型号,作为专有模型的开源替代方案。LLaMA模型,尤其是LLaMA 3和最新的LLaMA 4,证明了开源模型可以与专有解决方案相媲美。

适合:

什么因素会让一个人工智能模型“引人注目”?

Epoch AI 将符合以下四个标准之一的 AI 模型定义为“值得关注”。首先,它必须在技术上优于公认的基准模型。其次,它的引用率应超过 1000 次。第三,即使模型在技术上已经过时,其历史相关性也可以作为评判标准之一。第四,模型必须具有显著的实际应用价值。

这个定义不仅关注技术进步,还关注其在科学和经济领域的实际影响和相关性。因此,即使一个模型并非技术最先进的,但如果它能得到广泛的实际应用,也可以被认为是值得关注的。

Epoch AI 数据库收录了从 1950 年至今的 2400 多个机器学习模型,是目前公开可用的同类数据集中规模最大的。这一全面的数据集为深入分析 70 多年来人工智能的发展提供了坚实的基础。

在深度学习时代之前,人工智能是如何发展的?

2010年以前的人工智能发展史充满了乐观与失望的循环。20世纪50年代和60年代,人们普遍抱有极大的乐观情绪,弗兰克·罗森布拉特于1957年发明的感知器便是这种乐观情绪的象征。这些早期的神经网络使人们对人工智能的到来充满希望。

第一次人工智能寒冬始于20世纪70年代初,其导火索是马文·明斯基和西摩·帕普特于1969年出版的关于感知器局限性的著作。1973年英国议会发布的莱特希尔报告导致研究经费大幅削减。这一时期持续到1980年左右,严重阻碍了人工智能研究的发展。

20世纪80年代,随着MYCIN(一种医疗诊断系统)等专家系统的出现,神经网络迎来了复苏。与此同时,1986年,杰弗里·辛顿、大卫·鲁梅尔哈特和罗纳德·威廉姆斯开发了反向传播算法,使神经网络能够进行训练。早在1989年,扬·勒昆就开发了LeNet,这是一种用于手写识别的早期卷积神经网络。

第二次人工智能寒冬出现在20世纪80年代末,当时人们对专家系统和LISP机器寄予厚望,但最终却失望而归。这一阶段一直持续到90年代,其特点是对神经网络持怀疑态度。

深度学习背后的技术基础是什么?

深度学习革命的兴起离不开三项关键突破。高性能GPU的开发至关重要,因为它实现了海量数据的并行处理。NVIDIA于2007年推出的CUDA平台,使得机器学习能够利用GPU进行计算。

第二个必要条件是拥有庞大且高质量的数据集。ImageNet 由李飞飞于 2010 年发布,是首个提供超过 1000 万张带标签图像的数据集。如此庞大的数据量对于有效训练深度神经网络至关重要。

算法改进构成了第三个支柱。使用 ReLU 激活函数代替 sigmoid 函数显著加快了训练速度。改进的优化方法和正则化技术(例如 dropout)有助于解决过拟合问题。

人工智能训练的计算成本是如何发展的?

人工智能模型的训练成本呈指数级增长。2017年,最初的Transformer模型训练成本仅为930美元。2018年,BERT-Large的训练成本已达3300美元,而GPT-3在2020年的训练成本约为430万美元。

现代模型的成本更加惊人:GPT-4 的造价估计为 7840 万美元,而谷歌的 Gemini Ultra 造价约为 1.914 亿美元,可能是迄今为止训练成本最高的模型。这一趋势反映了模型复杂性和规模的不断增长。

据Epoch AI称,训练所需的计算能力大约每五个月翻一番。这一发展速度远远超过摩尔定律,表明人工智能研究正在迅速扩展。与此同时,这也导致人工智能研发集中在少数拥有必要资源的公司手中。

适合:

人工智能的进一步发展面临哪些挑战?

人工智能发展面临诸多重大挑战。针对复杂逻辑思维优化的推理模型最早可能在2026年就达到其扩展极限。巨额的计算成本限制了能够参与前沿人工智能研究的人员数量。

诸如幻觉之类的技术问题,即人工智能系统生成虚假信息,尚未得到彻底解决。与此同时,生成具有欺骗性的真实内容的可能性也引发了伦理问题,例如那张教皇身穿羽绒服的AI图像就曾引起广泛关注。

高质量训练数据的可用性正日益成为瓶颈。许多模型已经使用大量可用的互联网数据进行训练,因此需要新的数据生成方法。

人工智能发展如何影响社会?

深度学习革命已经对社会产生了巨大的影响。人工智能系统正在医疗诊断、金融和自动驾驶汽车等关键领域得到应用。其带来的积极变革潜力巨大,涵盖了从加速科学发现到个性化教育等诸多方面。

与此同时,新的风险也随之而来。制造逼真虚假内容的能力威胁着信息完整性。自动化可能会危及就业,德国联邦劳动部预计,到2035年,任何工作都将离不开人工智能软件。

人工智能能力集中在少数科技公司手中,引发了人们对这项强大技术民主控制的质疑。深度学习先驱之一杰弗里·辛顿等专家已就未来人工智能系统的潜在危险发出警告。

深度学习时代的AI先驱们创造了一项具有从根本上改变人类的潜力的技术。谷歌在开发168个重要的AI模型方面处于领先地位,紧随其后的是微软、OpenAI和Meta,这表明创新力量集中在少数几家关键企业手中。深度学习革命始于2010年,由AlexNet和Transformer架构等突破性成果推动,它已经改变了我们的日常生活,未来还将产生更加深远的影响。挑战在于如何利用这项强大的技术造福人类,同时最大限度地降低其风险。

适合:

 

您的AI转换,AI集成和AI平台行业专家

☑️我们的业务语言是英语或德语

☑️ 新:用您的国家语言进行通信!

 

数字先锋—— Konrad Wolfenstein

Konrad Wolfenstein

我很乐意作为个人顾问为您和我的团队提供服务。

您可以通过填写此处的联系表,或者直接致电+49 89 89 674 804 (慕尼黑)。我的电子邮件地址是: wolfenstein xpert.digital

我很期待我们的联合项目。

 

 

☑️ 为中小企业提供战略、咨询、规划和实施方面的支持

AI策略的创建或重组

☑️ 开拓业务发展


⭐️人工智能 (AI) - AI 博客、热点和内容中心⭐️ XPaper