⭐️ 인공 지능 (AI) -AI 블로그, 핫스팟 및 컨텐츠 허브 ⭐️ 디지털 인텔리전스 ⭐️ XPAPIT

언어 선택 📢

Meta는 New Llama 4 Scout, Maverick 및 Behemoth를 출판합니다

출판 : 2025 년 4 월 6 일 / 업데이트 : 2025 년 4 월 6 일 - 저자 : Konrad Wolfenstein

Meta는 New Llama 4 Scout, Maverick 및 Behemoth-Image를 출판합니다 : Xpert.Digital

LLAMA 4 : 메타에서 새로운 세대의 오픈 AI 시스템

Llama 4 공개 : 다음 AI 시대의 메타 키

Meta는 2025 년 4 월 5 일에 그의 AI 모델 인 LLAMA 4를 발표했습니다.이 새로운 모델은 Open AI 시스템 개발에서 상당한 진전을 나타내며 성능과 효율성을 크게 높이는 많은 획기적인 기능을 가지고 있습니다. LLAMA 4 시리즈는 서로 다른 모델로 구성되며 두 개는 이미 공개적으로 제공되며 가장 강력한 모델은 여전히 교육 단계에 있습니다.

적합:

간단히 설명 된 AI 모델 : AI의 기본, 음성 모델 및 추론을 이해합니다.

라마 4 모델 패밀리

Meta는 LLAMA 4 시리즈에서 세 가지 모델을 개발했으며 각 모델은 다양한 응용 프로그램에 최적화됩니다.

라마 4 스카우트

Llama 4 스카우트는 인상적인 기술 사양을 가진 소형 모델입니다.

16 명의 전문가가있는 170 억 개의 활성 매개 변수 (총 1 억 9 천만 파라미터)
int4 Quantization을 사용하여 단일 NVIDIA H100 GPU에서 작동 할 수 있습니다.
1 천만 개의 토큰의 현저하게 큰 컨텍스트 창이 있어이 용량을 가진 최초의 오픈 모델 중 하나입니다.

메타에 따르면, 스카우트는 Gemini 3, Gemini 2.0 Flash-Lite 및 Mistral 3.1과 같은 클래스의 다른 모델을 초과합니다. 특히 긴 문서의 요약, 사용자 데이터를 기반으로하는 개인화 및 많은 양의 지식에 대한 복잡한 결론과 같은 작업에 적합합니다.

라마 4 매버릭

Llama 4 Maverick은 사용 가능한 두 모델 중 더 강력합니다.

128 명의 전문가가있는 170 억 활성 매개 변수 (총 4 천억 개의 매개 변수)
실험용 채팅 버전은 Lmarena에서 ELO 1417에 도달했습니다
수많은 벤치 마크에서 GPT-4O 및 Gemini 2.0 플래시와 같은 모델을 초과합니다.

이 모델은 특히 Creative Writing과 같은 일반적인 지원 및 채팅 애플리케이션에 적합하며 추론 및 코딩 작업에서 DeepSeek V3과 비교할 수있는 결과를 보여 주지만 매개 변수의 절반이 표시됩니다.

llama 4 Behemoth

Llama 4 Behemoth는 메타의 가장 강력한 모델이며 아직 공개적으로 사용할 수 없습니다.

16 명의 전문가가있는 288 억 개의 활성 매개 변수 (총 2 조 매개 변수)
Meta에 따르면, 여러 STEM 벤치 마크의 경우 GPT-4.5, Claude Sonnet 3.7 및 Gemini 2.0 Pro를 초과합니다.
작은 llama 4 모델의 "교사 모델"역할을합니다.

Behemoth는 현재 여전히 훈련 단계에 있으며 나중에 출판 될 예정입니다.

기술 혁신

LLAMA 4 모델 시리즈는 성능과 효율성을 향상시키는 몇 가지 중요한 기술 혁신을 소개합니다.

전문가 (MOE) 건축의 혼합

LLAMA 4에서 가장 중요한 혁신 중 하나는 전문가 (MOE) 아키텍처의 혼합입니다. 여기서 모든 토큰에 대해 모델 매개 변수의 일부만 활성화됩니다.

이것은 계산 노력과 대기 시간을 크게 줄이고 고성능은 보존됩니다.
Llama 4 Maverick에서 각 토큰은 공동 전문가와 128 명의 독창적 인 전문가 중 하나에 의해 처리됩니다.
이 아키텍처는 추론 비용을 늘리지 않고 모델의 총 매개 변수를 늘릴 수 있습니다.

초기 융합을 갖는 기본 다중 분비

LLAMA 4는 초기 퓨전에 의한 기본 다중 분류를 가진 최초의 오픈 모델입니다.

텍스트 및 이미지 토큰은 균일 한 모델 아키텍처에 통합됩니다.
이를 통해 대량의 텍스트, 이미지 및 비디오 데이터로 공동 예비 교육이 가능합니다.
텍스트 및 이미지에 별도의 매개 변수를 사용한 llama 3.2와 달리 Llama 4는 동일한 매개 변수를 가진 두 가지 양식을 모두 이해합니다.

매우 긴 컨텍스트 창

Llama 4 스카우트의 매우 긴 맥락 창은 특히 인상적입니다.

1 천만 개의 토큰으로 사용 가능한 대부분의 모델을 분명히 초과합니다.
이를 통해 매우 긴 문서, 전체 코드베이스 또는 광범위한 대화를 처리 할 수 있습니다.
Irope 아키텍처 (인터리브주의 층)는이를 가능하게합니다

새로운 훈련 방법

메타는 라마 4의 훈련을 위해 몇 가지 혁신적인 방법을 사용했습니다.

METAP : 중요한 모델 하이퍼 아메리카의 강력한 조정을위한 기술
FP8 정밀도 : 효율적인 교육을 위해 8 비트 슬라이드 메이드 숫자 사용
공동-장관 : Llama 4 Behemoth의 사용 소규모 모델의 교사 모델로
강화 기능을 갖춘 완전 비동기 온라인 학습 : 대규모 학습을위한 새로운 인프라

가용성 및 통합

LLAMA 4 모델은 다양한 플랫폼 및 서비스를 통해 제공됩니다.

다운로드 및 클라우드 제공 업체

모델 스카우트와 매버릭은 메타에서 직접 또는 포옹을 통해 다운로드 할 수 있습니다.
다양한 클라우드 플랫폼을 통해도 제공됩니다.
- Cloudflare Workers ai
- Azure AI Foundry 및 Azure Databricks
- Google Cloud의 정점 AI
- 다른 파트너는 앞으로 따라갑니다

메타 제품에 통합

메타는 이미 라마 4의 다양한 플랫폼에서 AI 조수를 업데이트했습니다.

WhatsApp, Messenger 및 Instagram은 40 개국에서 직접 직접
Meta.ai 웹 사이트
그러나 멀티 모달 함수는 현재 미국의 영어 -언어 사용자에게만 사용할 수 있습니다.

적합:

독일의 메타 AI가 여기 있습니다! WhatsApp, Instagram & Facebook Get AI와 함께 미국 버전에서 중요한 차이점

라이센스와 논쟁

메타 라마 4는“오픈 소스”를 말하지만, 라이센스에는 논쟁을 일으킨 몇 가지 제한이 있습니다.

라이센스 제한

LLAMA 4 커뮤니티 라이센스에는 몇 가지 제한 사항이 포함되어 있습니다.

월간 7 억 명이 넘는 회사는 Meta의 특별 라이센스가 필요합니다.
모델은 아마도 규제 요구 사항으로 인해 EU의 사용자와 회사를 사용하거나 배포 할 수 없습니다.
파생 된 모델의 이름 지정 및 속성에 관한 요구 사항이 있습니다.

"오픈 소스"에 대한 토론

Llama 4가 실제로 "오픈 소스"라고 불러야하는지에 대한 논쟁이 있습니다.

2023 년에 LLAMA 라이센스의 제한이“ '오픈 소스'”카테고리를 꺼내는 것으로 밝혀진 오픈 소스 이니셔티브
비평가들은 그것이 실제 오픈 소스 소프트웨어보다 "소스 오픈"또는 "개방형 가중치"모델에 가깝다고 주장합니다.
자체 법률 부서가없는 소기업에게는 라이센스 제한이 문제가 될 수 있습니다.

미래 계획

메타는 이미 Llama 4 이상에 대한 그의 미래 계획에 대한 통찰력을 제공했습니다.

Llamacon 및 기타 공지 사항

Meta는 2025 년 4 월 29 일에 첫 번째 Llamacon 컨퍼런스를 조직 할 예정이며, AI 모델 및 제품 계획에 대한 자세한 내용은 발표 될 예정입니다.
이 회사는 또한 2 분기에 메타 chat 봇에 대한 전용 응용 프로그램을 게시 할 계획입니다.

언어 능력의 확장

메타는보다 자연스러운 대화를 가능하게하기 위해 LLAMA 4의 언어 기술을 향상시키기 위해 노력하고 있습니다.
목표는 사용자가 AI 모델을 방해 할 수있는 더 유동적이고 양면 대화를 가능하게하는 것입니다.
Meta의 최고 제품 책임자 인 Chris Cox는 다가오는 Llama 4를 언어를 텍스트로 변환하는 대신 모국어를 가능하게하는 "Omni 모델"이라고 설명했습니다.

에이전트 AI 및 확장 기술

Mark Zuckerberg는 LLAMA 4가 새로운 응용 프로그램을 가능하게하는“에이전트 기술”을 가질 것이라고 발표했습니다.
Meta는 "일반화 된 행동을 수행하고 물론 사람들과 의사 소통하고 도전적인 문제를 해결하는"AI 모델을 개발하는 것을 목표로합니다.
이 회사는 예약 또는 비디오 제작과 같은 에이전트 목적으로 AI 보조원을위한 프리미엄 구독을 제공하는 것을 고려하고 있습니다.

Llama 4가 AI 풍경의 전환점 인 이유

LLAMA 4의 출판물은 경쟁이 치열한 지역에서 생성 AI의 주요 영역이되기위한 메타스 전략의 중요한 단계를 나타냅니다. Meta는 전문가 아키텍처, 네이티브 다중 분류 및 인상적인 상황 창의 혼합을 도입함으로써 열린 모델이 대기업 회사의 독점 모델을 따라 잡을 수 있음을 보여줍니다.

라이센스에 대한 논란과 라마 4 4가 실제로 "오픈 소스"라고 불리는지에 대한 문제에도 불구하고 기술 진보는 중요한 이정표입니다. 모델이 텍스트와 이미지를 처리하는 능력은 개발자와 회사의 새로운 기회를 열어줍니다.

뛰어난 Llama 4 Behemoth와 확장 된 언어 및 에이전트 기술에 대한 발표 된 계획을 통해 Meta는 AI에 대한 투자를 더욱 강화할 것임이 분명합니다. 앞으로 몇 달은 이러한 새로운 모델이 AI 환경을 어떻게 변화시키는지를 보여줄 것입니다. Mark Zuckerberg가 예측 한 바와 같이 실제로 인공 지능 분야에서 열린 AI 모델을 만드는 데 도움이 될 것입니다.

적합: