Llama 4:来自 Meta 的新一代开放式人工智能系统。
Llama 4 揭晓:Meta 通往人工智能新时代的关键
2025年4月5日,Meta公司发布了最新一代人工智能模型Llama 4。这些新模型代表了开放式人工智能系统发展的一个重大进步,并具备多项突破性功能,可显著提升其性能和效率。Llama 4系列包含多个模型,其中两个已公开发布,而功能最强大的模型仍在训练阶段。
适合:
Llama 4 型号系列
Meta 开发了 Llama 4 系列的三种不同型号,每种型号都针对不同的使用场景进行了优化:
羊驼4侦察兵
Llama 4 Scout 是一款紧凑型车型,拥有令人印象深刻的技术规格:
- 170亿个活跃参数,16位专家(共计1090亿个参数)
- 可在单个 NVIDIA H100 GPU 上运行,支持 Int4 量化
- 它拥有高达 1000 万个代币的超大上下文窗口,使其成为首批具有这种容量的开放模型之一。
据 Meta 称,Scout 的性能优于同类其他型号,例如 Gemini 3、Gemini 2.0 Flash-Lite 和 Mistral 3.1。它尤其适合诸如总结长篇文档、根据用户数据个性化内容以及从大量知识中得出复杂结论等任务。
羊驼4号特立独行者
Llama 4 Maverick 是两款可选型号中动力更强劲的一款:
- 170亿个活跃参数,128位专家参与(总共4000亿个参数)
- 实验性聊天版本在LMArena上达到了ELO 1417。
- 据 Meta 称,它在众多基准测试中都优于 GPT-4o 和 Gemini 2.0 Flash 等模型。
该模型特别适用于一般辅助和聊天应用程序,例如创意写作,并且在推理和编码任务中显示出与 DeepSeek v3 相当的结果,但参数只有一半。
羊驼4巨兽
Llama 4 Behemoth 是 Meta 最强大的模型,但目前尚未公开发售:
- 2880亿个活跃参数,16位专家参与(总共近2万亿个参数)
- 据 Meta 称,它在多个 STEM 基准测试中优于 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。
- 可作为较小的 Llama 4 型号的“教师模型”。
巨兽目前仍处于训练阶段,将在稍后日期发布。
技术创新
Llama 4 系列车型引入了多项重大技术创新,提高了其性能和效率:
专家混合(教育部)架构
Llama 4 最重要的创新之一是混合专家(MoE)架构,其中每个标记仅激活模型参数的一个子集:
- 这显著降低了计算量和延迟,同时保持了高性能。
- 在 Llama 4 Maverick 中,每个令牌由一个共享专家和 128 个路由专家中的一个进行处理。
- 这种架构使得在不增加推理成本的情况下增加模型的整体参数成为可能。
早期融合的原生多模态
Llama 4 是首个通过早期融合实现原生多模态的开放式模型:
- 文本和图像标记被集成到一个统一的模型架构中。
- 这使得利用大量文本、图像和视频数据进行联合预训练成为可能。
- 与 Llama 3.2 对文本和图像使用单独的参数不同,Llama 4 使用相同的参数原生理解这两种模态。
极长的上下文窗口
Llama 4 Scout 的超长上下文窗口尤其令人印象深刻:
- 凭借 1000 万枚代币,它远远超过了大多数现有模型。
- 这使得处理非常长的文档、整个代码库或大量的对话成为可能。
- iRoPE架构(交错注意力层)使这一切成为可能。
新的训练方法
Meta采用了几种创新方法来训练Llama 4:
- MetaP:一种稳健地调整关键模型超参数的技术
- FP8 精度:使用 8 位浮点数进行高效训练
- 共蒸馏:以 Llama 4 Behemoth 为教学模型,用于小型模型
- 完全异步在线学习与放大:大规模学习的新基础设施
可用性和集成
Llama 4 型号可通过各种平台和服务获得:
下载和云服务提供商
- Scout 和 Maverick 模型可以直接从 Meta 下载,也可以通过 Hugging Face 下载。
- 它们还可以通过各种云平台获取:
- Cloudflare Workers AI
- Azure AI Foundry 和 Azure Databricks
- 谷歌云的Vertex AI
- 未来几天还将有更多合作伙伴加入。
整合到元产品中
Meta 已在多个平台上将其 AI 助手更新至 Llama 4:
- WhatsApp、Messenger 和 Instagram Direct 在 40 个不同的国家/地区可用
- Meta.AI 网站
- 然而,目前多模态功能仅对美国的英语用户开放。
适合:
许可与争议
尽管 Meta Llama 4 被描述为“开源软件”,但其许可证中的一些限制引发了争议:
许可限制
Llama 4 社区许可协议包含以下几项限制:
- 月活跃用户超过 7 亿的公司需要从 Meta 获得特殊许可。
- 欧盟用户和公司显然不允许使用或分发这些模型,据推测是由于监管要求。
- 对于衍生模型的命名和归属有相关要求。
关于“开源”的争论
关于 Llama 4 是否应该被称为“开源软件”存在争议:
- 开源促进会于 2023 年认定,Llama 许可证中的限制使其“不属于‘开源’范畴”。
- 批评人士认为,它更像是“源代码开放”或“开放权重”模式,而不是真正的开源软件。
- 对于没有自己法务部门的小企业来说,许可限制可能会带来问题。
未来计划
Meta已经透露了一些关于Llama 4及未来计划的信息:
LlamaCon及其他公告
- Meta 将于 2025 年 4 月 29 日举办首届 LlamaCon 大会,届时将公布有关其 AI 模型和产品计划的更多细节。
- 该公司还计划在第二季度发布一款专门用于其元聊天机器人的应用程序。
提升语言技能
- Meta 正在努力提升 Llama 4 的语言能力,以实现更自然的对话。
- 目标是实现更流畅的双向对话,用户可以打断人工智能模型的对话。
- Meta 的首席产品官 Chris Cox 将即将推出的 Llama 4 描述为“全能模型”,它支持母语,而不是将语音翻译成文本。
智能体人工智能和增强能力
- 马克·扎克伯格宣布,Llama 4 将具备“代理功能”,这将实现新的应用场景。
- Meta 的目标是开发能够“执行通用操作、与人类自然交流并解决具有挑战性的问题”的人工智能模型。
- 该公司正在考虑为其人工智能助手提供高级订阅服务,用于预订或视频制作等与代理相关的用途。
为什么 Llama 4 是人工智能领域的一个转折点
Llama 4 的发布标志着 Meta 在竞争激烈的生成式人工智能领域迈出了重要一步,力图成为该领域的领导者。凭借混合专家架构、原生多模态功能以及令人印象深刻的超长上下文窗口,Meta 证明了开源模型完全可以与大型科技公司的专有模型相媲美。
尽管围绕授权许可存在争议,以及Llama 4是否真正应该被称为“开源软件”仍存在疑问,但其技术进步代表着一个重要的里程碑。该模型处理文本和图像的能力为开发者和企业开辟了新的可能性。
鉴于 Llama 4 Behemoth 仍在开发中,且 Meta 已宣布将增强其语言和智能体功能,显然该公司将进一步加大对人工智能的投资。未来几个月将见证这些新模型如何改变人工智能格局,以及它们是否真如马克·扎克伯格所预言的那样,助力开源人工智能模型成为人工智能领域的主导力量。
适合:
您的全球营销和业务发展合作伙伴
☑️我们的业务语言是英语或德语
☑️ 新:用您的国家语言进行通信!
我很乐意作为个人顾问为您和我的团队提供服务。
您可以通过填写此处的联系表,或者直接致电+49 89 89 674 804 (慕尼黑)。我的电子邮件地址是: wolfenstein ∂ xpert.digital
我很期待我们的联合项目。


