출판 : 2025 년 4 월 6 일 / 업데이트 : 2025 년 4 월 6 일 - 저자 : Konrad Wolfenstein
LLAMA 4 : 메타에서 새로운 세대의 오픈 AI 시스템
Llama 4 공개 : 다음 AI 시대의 메타 키
Meta는 2025 년 4 월 5 일에 그의 AI 모델 인 LLAMA 4를 발표했습니다.이 새로운 모델은 Open AI 시스템 개발에서 상당한 진전을 나타내며 성능과 효율성을 크게 높이는 많은 획기적인 기능을 가지고 있습니다. LLAMA 4 시리즈는 서로 다른 모델로 구성되며 두 개는 이미 공개적으로 제공되며 가장 강력한 모델은 여전히 교육 단계에 있습니다.
적합:
라마 4 모델 패밀리
Meta는 LLAMA 4 시리즈에서 세 가지 모델을 개발했으며 각 모델은 다양한 응용 프로그램에 최적화됩니다.
라마 4 스카우트
Llama 4 스카우트는 인상적인 기술 사양을 가진 소형 모델입니다.
- 16 명의 전문가가있는 170 억 개의 활성 매개 변수 (총 1 억 9 천만 파라미터)
- int4 Quantization을 사용하여 단일 NVIDIA H100 GPU에서 작동 할 수 있습니다.
- 1 천만 개의 토큰의 현저하게 큰 컨텍스트 창이 있어이 용량을 가진 최초의 오픈 모델 중 하나입니다.
메타에 따르면, 스카우트는 Gemini 3, Gemini 2.0 Flash-Lite 및 Mistral 3.1과 같은 클래스의 다른 모델을 초과합니다. 특히 긴 문서의 요약, 사용자 데이터를 기반으로하는 개인화 및 많은 양의 지식에 대한 복잡한 결론과 같은 작업에 적합합니다.
라마 4 매버릭
Llama 4 Maverick은 사용 가능한 두 모델 중 더 강력합니다.
- 128 명의 전문가가있는 170 억 활성 매개 변수 (총 4 천억 개의 매개 변수)
- 실험용 채팅 버전은 Lmarena에서 ELO 1417에 도달했습니다
- 수많은 벤치 마크에서 GPT-4O 및 Gemini 2.0 플래시와 같은 모델을 초과합니다.
이 모델은 특히 Creative Writing과 같은 일반적인 지원 및 채팅 애플리케이션에 적합하며 추론 및 코딩 작업에서 DeepSeek V3과 비교할 수있는 결과를 보여 주지만 매개 변수의 절반이 표시됩니다.
llama 4 Behemoth
Llama 4 Behemoth는 메타의 가장 강력한 모델이며 아직 공개적으로 사용할 수 없습니다.
- 16 명의 전문가가있는 288 억 개의 활성 매개 변수 (총 2 조 매개 변수)
- Meta에 따르면, 여러 STEM 벤치 마크의 경우 GPT-4.5, Claude Sonnet 3.7 및 Gemini 2.0 Pro를 초과합니다.
- 작은 llama 4 모델의 "교사 모델"역할을합니다.
Behemoth는 현재 여전히 훈련 단계에 있으며 나중에 출판 될 예정입니다.
기술 혁신
LLAMA 4 모델 시리즈는 성능과 효율성을 향상시키는 몇 가지 중요한 기술 혁신을 소개합니다.
전문가 (MOE) 건축의 혼합
LLAMA 4에서 가장 중요한 혁신 중 하나는 전문가 (MOE) 아키텍처의 혼합입니다. 여기서 모든 토큰에 대해 모델 매개 변수의 일부만 활성화됩니다.
- 이것은 계산 노력과 대기 시간을 크게 줄이고 고성능은 보존됩니다.
- Llama 4 Maverick에서 각 토큰은 공동 전문가와 128 명의 독창적 인 전문가 중 하나에 의해 처리됩니다.
- 이 아키텍처는 추론 비용을 늘리지 않고 모델의 총 매개 변수를 늘릴 수 있습니다.
초기 융합을 갖는 기본 다중 분비
LLAMA 4는 초기 퓨전에 의한 기본 다중 분류를 가진 최초의 오픈 모델입니다.
- 텍스트 및 이미지 토큰은 균일 한 모델 아키텍처에 통합됩니다.
- 이를 통해 대량의 텍스트, 이미지 및 비디오 데이터로 공동 예비 교육이 가능합니다.
- 텍스트 및 이미지에 별도의 매개 변수를 사용한 llama 3.2와 달리 Llama 4는 동일한 매개 변수를 가진 두 가지 양식을 모두 이해합니다.
매우 긴 컨텍스트 창
Llama 4 스카우트의 매우 긴 맥락 창은 특히 인상적입니다.
- 1 천만 개의 토큰으로 사용 가능한 대부분의 모델을 분명히 초과합니다.
- 이를 통해 매우 긴 문서, 전체 코드베이스 또는 광범위한 대화를 처리 할 수 있습니다.
- Irope 아키텍처 (인터리브주의 층)는이를 가능하게합니다
새로운 훈련 방법
메타는 라마 4의 훈련을 위해 몇 가지 혁신적인 방법을 사용했습니다.
- METAP : 중요한 모델 하이퍼 아메리카의 강력한 조정을위한 기술
- FP8 정밀도 : 효율적인 교육을 위해 8 비트 슬라이드 메이드 숫자 사용
- 공동-장관 : Llama 4 Behemoth의 사용 소규모 모델의 교사 모델로
- 강화 기능을 갖춘 완전 비동기 온라인 학습 : 대규모 학습을위한 새로운 인프라
가용성 및 통합
LLAMA 4 모델은 다양한 플랫폼 및 서비스를 통해 제공됩니다.
다운로드 및 클라우드 제공 업체
- 모델 스카우트와 매버릭은 메타에서 직접 또는 포옹을 통해 다운로드 할 수 있습니다.
- 다양한 클라우드 플랫폼을 통해도 제공됩니다.
- Cloudflare Workers ai
- Azure AI Foundry 및 Azure Databricks
- Google Cloud의 정점 AI
- 다른 파트너는 앞으로 따라갑니다
메타 제품에 통합
메타는 이미 라마 4의 다양한 플랫폼에서 AI 조수를 업데이트했습니다.
- WhatsApp, Messenger 및 Instagram은 40 개국에서 직접 직접
- Meta.ai 웹 사이트
- 그러나 멀티 모달 함수는 현재 미국의 영어 -언어 사용자에게만 사용할 수 있습니다.
적합:
라이센스와 논쟁
메타 라마 4는“오픈 소스”를 말하지만, 라이센스에는 논쟁을 일으킨 몇 가지 제한이 있습니다.
라이센스 제한
LLAMA 4 커뮤니티 라이센스에는 몇 가지 제한 사항이 포함되어 있습니다.
- 월간 7 억 명이 넘는 회사는 Meta의 특별 라이센스가 필요합니다.
- 모델은 아마도 규제 요구 사항으로 인해 EU의 사용자와 회사를 사용하거나 배포 할 수 없습니다.
- 파생 된 모델의 이름 지정 및 속성에 관한 요구 사항이 있습니다.
"오픈 소스"에 대한 토론
Llama 4가 실제로 "오픈 소스"라고 불러야하는지에 대한 논쟁이 있습니다.
- 2023 년에 LLAMA 라이센스의 제한이“ '오픈 소스'”카테고리를 꺼내는 것으로 밝혀진 오픈 소스 이니셔티브
- 비평가들은 그것이 실제 오픈 소스 소프트웨어보다 "소스 오픈"또는 "개방형 가중치"모델에 가깝다고 주장합니다.
- 자체 법률 부서가없는 소기업에게는 라이센스 제한이 문제가 될 수 있습니다.
미래 계획
메타는 이미 Llama 4 이상에 대한 그의 미래 계획에 대한 통찰력을 제공했습니다.
Llamacon 및 기타 공지 사항
- Meta는 2025 년 4 월 29 일에 첫 번째 Llamacon 컨퍼런스를 조직 할 예정이며, AI 모델 및 제품 계획에 대한 자세한 내용은 발표 될 예정입니다.
- 이 회사는 또한 2 분기에 메타 chat 봇에 대한 전용 응용 프로그램을 게시 할 계획입니다.
언어 능력의 확장
- 메타는보다 자연스러운 대화를 가능하게하기 위해 LLAMA 4의 언어 기술을 향상시키기 위해 노력하고 있습니다.
- 목표는 사용자가 AI 모델을 방해 할 수있는 더 유동적이고 양면 대화를 가능하게하는 것입니다.
- Meta의 최고 제품 책임자 인 Chris Cox는 다가오는 Llama 4를 언어를 텍스트로 변환하는 대신 모국어를 가능하게하는 "Omni 모델"이라고 설명했습니다.
에이전트 AI 및 확장 기술
- Mark Zuckerberg는 LLAMA 4가 새로운 응용 프로그램을 가능하게하는“에이전트 기술”을 가질 것이라고 발표했습니다.
- Meta는 "일반화 된 행동을 수행하고 물론 사람들과 의사 소통하고 도전적인 문제를 해결하는"AI 모델을 개발하는 것을 목표로합니다.
- 이 회사는 예약 또는 비디오 제작과 같은 에이전트 목적으로 AI 보조원을위한 프리미엄 구독을 제공하는 것을 고려하고 있습니다.
Llama 4가 AI 풍경의 전환점 인 이유
LLAMA 4의 출판물은 경쟁이 치열한 지역에서 생성 AI의 주요 영역이되기위한 메타스 전략의 중요한 단계를 나타냅니다. Meta는 전문가 아키텍처, 네이티브 다중 분류 및 인상적인 상황 창의 혼합을 도입함으로써 열린 모델이 대기업 회사의 독점 모델을 따라 잡을 수 있음을 보여줍니다.
라이센스에 대한 논란과 라마 4 4가 실제로 "오픈 소스"라고 불리는지에 대한 문제에도 불구하고 기술 진보는 중요한 이정표입니다. 모델이 텍스트와 이미지를 처리하는 능력은 개발자와 회사의 새로운 기회를 열어줍니다.
뛰어난 Llama 4 Behemoth와 확장 된 언어 및 에이전트 기술에 대한 발표 된 계획을 통해 Meta는 AI에 대한 투자를 더욱 강화할 것임이 분명합니다. 앞으로 몇 달은 이러한 새로운 모델이 AI 환경을 어떻게 변화시키는지를 보여줄 것입니다. Mark Zuckerberg가 예측 한 바와 같이 실제로 인공 지능 분야에서 열린 AI 모델을 만드는 데 도움이 될 것입니다.
적합:
귀하의 글로벌 마케팅 및 비즈니스 개발 파트너
✔️ 우리의 비즈니스 언어는 영어 또는 독일어입니다.
✔️ 새로운 기능: 자국어로 된 통신!
나는 귀하와 우리 팀에 개인 고문으로 봉사하게 되어 기쁘게 생각합니다.
문의 양식을 작성하여 연락하시거나 +49 89 89 674 804 (뮌헨) 로 전화해 주세요 . 내 이메일 주소는: Wolfenstein ∂ xpert.digital
나는 우리의 공동 프로젝트를 기대하고 있습니다.