网站图标 专家数码

Meta出版了新拉玛4侦察兵,小牛和庞然大物

Meta出版了新拉玛4侦察兵,小牛和庞然大物

Meta出版了新拉玛4侦察兵,小牛和庞然大物图像:xpert.digital

Llama 4:Meta的新一代开放AI系统

骆驼4揭示了:下一个AI时代的元关键

梅塔(Meta)于2025年4月5日介绍了他的AI模型Llama 4 4。这些新模型在开放AI系统的开发中取得了重大进展,并具有许多突破性的功能,可显着提高其性能和效率。 Llama 4系列由不同的模型组成,其中两个已经公开可用,而最强大的模型仍处于培训阶段。

适合:

Llama 4模型家族

Meta在Llama 4系列中开发了三种不同的模型,每个模型均针对不同的应用进行了优化:

美洲驼4侦察员

Llama 4 Scout是一个紧凑的模型,具有令人印象深刻的技术规格:

  • 170亿个活动参数,有16位专家(共1​​0090亿参数)
  • 可以在具有INT4量化的单个NVIDIA H100 GPU上操作
  • 具有1000万个令牌的上下文窗口非常大,这使其成为具有这种能力的第一个开放型号之一

根据Meta的说法,Scout超过了Gemini 3,Gemini 2.0 Flash-Lite和Mistral 3.1等同类中的其他模型。它特别适用于任务,例如长期文档的摘要,基于用户数据的个性化以及有关大量知识的复杂结论。

美洲驼4小牛

Llama 4 Maverick是两个可用模型中更强大的:

  • 170亿个活动参数,有128位专家(共4000亿参数)
  • 实验性聊天版本在lmarena上达到了ELO 1417
  • 超过众多基准中的GPT-4O和Gemini 2.0闪光等型号

该模型特别适合一般帮助和聊天应用程序,例如创意写作,并显示了与DeepSeek V3在推理和编码任务中相当的结果,但与一半的参数相当。

骆驼4庞然大物

Llama 4 Behemoth是Metas最强大的模型,尚未公开可用:

  • 2880亿个活动参数,有16位专家(总计近2万亿个参数)
  • 根据Meta的说法,它超过了GPT-4.5,Claude Sonnet 3.7和Gemini 2.0 Pro的几个茎基准
  • 作为较小的美洲驼4型模型的“教师模型”

庞然大物目前仍处于培训阶段,将在以后发布。

技术创新

Llama 4 Model系列介绍了一些重要的技术创新,以提高其性能和效率:

专家(MOE)建筑的混合物

Llama 4上最重要的创新之一是专家(MOE)体系结构的混合物,其中仅激活每个标记的模型参数的一部分:

  • 这大大减少了计算工作和延迟,而高性能则保留
  • 在Llama 4 Maverick,每个代币都由一个普通专家和128位Gerized专家之一处理
  • 该体系结构可以增加模型的总参数而不增加推理成本

与早期融合的本地多模式

Llama 4是第一个通过早期融合的本地多模式的开放模型:

  • 文本和图像令牌集成在统一模型体系结构中
  • 这可以通过大量文本,图像和视频数据进行联合初步培训
  • 与使用单独的参数用于文本和图像的Llama 3.2相反,Llama 4理解这两个模态,具有相同参数

非常长的上下文窗口

Llama 4 Scout的极长上下文窗口特别令人印象深刻:

  • 具有1000万个令牌,显然超出了大多数可用型号
  • 这使得可以处理非常长的文档,整个代码库或广泛的对话
  • iRope架构(交错的注意力层)使这成为可能

新的培训方法

Meta使用了几种创新方法来训练Llama 4:

  • METEAP:一种用于核心模型高压仪的鲁棒协调的技术
  • FP8精度:使用8位幻灯片制造的数字进行有效培训
  • 共同依据:使用Llama 4庞然大物作为较小模型的教师模型
  • 使用增援部队的完全异步在线学习:大规模学习的新基础架构

可用性和集成

Llama 4型号可通过各种平台和服务获得:

下载和云提供商

  • 模型侦察兵和小牛可以直接从元或拥抱脸下载
  • 它们也可以通过各种云平台获得:
    • Cloudflare工人AI
    • Azure AI Foundry和Azure Databricks
    • Google Cloud的顶点AI
    • 其他合作伙伴将在未来几天跟随

集成到元产品

Meta已经在Llama 4的各个平台上更新了其AI助手:

  • WhatsApp,Messenger和Instagram直接在40个不同的国家
  • meta.ai网站
  • 但是,当前仅适用于美国英语用户的多模式功能

适合:

许可和争议

尽管Meta Llama 4是指“开源”,但许可证中有一些引发争议的限制:

许可限制

Llama 4社区许可包含几个限制:

  • 拥有超过7亿个活跃用户的公司需要META的特殊许可证
  • 显然,这些模型不允许使用或分配欧盟的用户和公司,大概是由于监管要求
  • 关于派生模型的命名和归因有要求

关于“开源”的辩论

关于骆驼4是否应该被称为“开源”的辩论:

  • 2023年发现的开源倡议是,Llama许可证中的限制将其“从'开源'”类别中取出
  • 评论家认为,它更像是“源开放”或“具有开放权重”模型,而不是真正的开源软件
  • 许可限制对于没有自己的法律部门的小型公司可能会有问题

未来计划

Meta已经对他对Llama 4及以后的未来计划提供了一些见解:

美洲狮和其他公告

  • Meta将于2025年4月29日组织第一次Llamacon会议,其中将宣布有关其AI模型和产品计划的更多详细信息
  • 该公司还计划在第二季度发布其Meta-Chat机器人的专用申请

扩大语言技能

  • Meta正在致力于提高Llama 4的语言技能,以实现更多自然的对话
  • 目的是启用更多流体,双面对话,用户可以中断AI模型
  • Meta首席产品官Chris Cox将即将到来的Llama 4描述为一种“ Omni模型”,可以使母语而不是将语言翻译成文本

代理AI和扩展技能

  • 马克·扎克伯格(Mark Zuckerberg
  • META旨在开发“执行广义行动,当然与人沟通并解决具有挑战性的问题”的AI模型”
  • 该公司正在考虑为其AI助理提供高级订阅,以供预订或视频制作等代理商

为什么骆驼4是AI景观中的转折点

Llama 4的出版代表了Metas战略迈出的重要一步,是成为竞争激烈的地区生成AI的领先领域。随着专家体系结构,本地多模式和令人印象深刻的上下文窗口的混合,Meta表明,开放模型可以跟上大型技术公司的专有模型。

尽管关于许可的争议以及是否应将骆驼4真正称为“开源”的问题,但技术进步是一个重要的里程碑。模型处理文本和图像的能力为开发人员和公司打开了新的机会。

随着杰出的Llama 4巨兽和宣布的扩展语言和代理技能的计划,很明显,元将进一步加强其对AI的投资。接下来的几个月将显示这些新模型如何改变AI景观以及马克·扎克伯格(Mark Zuckerberg)的预测,它们是否实际上将有助于在人工智能领域开放AI模型。

适合:

 

您的全球营销和业务发展合作伙伴

☑️我们的业务语言是英语或德语

☑️ 新:用您的国家语言进行通信!

 

康拉德·德军总部

我很乐意作为个人顾问为您和我的团队提供服务。

您可以通过填写此处的联系表,或者直接致电+49 89 89 674 804 (慕尼黑)。我的电子邮件地址是: wolfenstein xpert.digital

我很期待我们的联合项目。

 

 

☑️ 为中小企业提供战略、咨询、规划和实施方面的支持

☑️ 创建或调整数字战略和数字化

☑️国际销售流程的扩展和优化

☑️ 全球数字 B2B 交易平台

☑️ 先锋业务发展/营销/公关/贸易展览会

退出手机版