웹사이트 아이콘 엑스퍼트.디지털

Meta에서 새로운 AI 모델 시리즈인 Llama 4 Scout, Maverick 및 Behemoth를 출시했습니다

Meta에서 새로운 AI 모델 시리즈인 Llama 4 Scout, Maverick 및 Behemoth를 출시했습니다

Meta, 새로운 AI 모델 시리즈 Llama 4 Scout, Maverick 및 Behemoth 출시 – 이미지: Xpert.Digital

Llama 4: Meta에서 선보이는 차세대 오픈 AI 시스템

Llama 4 공개: Meta가 제시하는 차세대 AI의 핵심

2025년 4월 5일, Meta는 최신 AI 모델인 Llama 4를 공개했습니다. 이 새로운 모델은 오픈 AI 시스템 개발에 있어 중요한 진전을 나타내며, 성능과 효율성을 크게 향상시키는 여러 획기적인 기능을 갖추고 있습니다. Llama 4 시리즈는 여러 모델로 구성되어 있으며, 그중 두 개는 이미 공개되었고, 가장 강력한 모델은 현재 학습 단계에 있습니다.

이와 관련된 내용:

라마 4 모델 제품군

Meta는 Llama 4 시리즈에서 각각 다른 사용 사례에 최적화된 세 가지 모델을 개발했습니다

라마 4 스카우트

Llama 4 Scout는 인상적인 기술 사양을 갖춘 소형 모델입니다

  • 16명의 전문가가 관리하는 170억 개의 활성 매개변수(총 1090억 개의 매개변수)
  • Int4 양자화를 사용하는 단일 NVIDIA H100 GPU에서 작동할 수 있습니다
  • 이 모델은 1천만 토큰이라는 매우 큰 컨텍스트 창을 특징으로 하며, 이러한 용량을 가진 최초의 오픈 모델 중 하나입니다

Meta에 따르면 Scout는 Gemini 3, Gemini 2.0 Flash-Lite, Mistral 3.1과 같은 동급 모델보다 뛰어난 성능을 보입니다. 특히 긴 문서를 요약하거나, 사용자 데이터를 기반으로 콘텐츠를 개인화하거나, 방대한 데이터에서 복잡한 결론을 도출하는 작업에 매우 적합합니다.

라마 4 매버릭

Llama 4 Maverick은 현재 판매되는 두 모델 중 더 강력한 모델입니다

  • 128명의 전문가가 관리하는 170억 개의 활성 매개변수(총 4천억 개의 매개변수)
  • 실험적인 채팅 버전은 LMArena에서 ELO 1417을 기록했습니다
  • Meta에 따르면, 이 알고리즘은 여러 벤치마크에서 GPT-4o 및 Gemini 2.0 Flash와 같은 모델보다 우수한 성능을 보입니다

이 모델은 창작 글쓰기와 같은 일반적인 지원 및 채팅 애플리케이션에 특히 적합하며, 추론 및 코딩 작업에서 DeepSeek v3와 유사한 결과를 보여주지만 매개변수는 절반만 사용합니다.

라마 4 베헤모스

Llama 4 Behemoth는 Meta에서 가장 강력한 모델이지만, 아직 일반에 공개되지 않았습니다

  • 16명의 전문가가 2,880억 개의 활성 매개변수를 관리합니다(총 2조 개에 가까운 매개변수)
  • Meta에 따르면, 이 알고리즘은 여러 STEM 벤치마크에서 GPT-4.5, Claude Sonnet 3.7 및 Gemini 2.0 Pro보다 우수한 성능을 보입니다
  • 더 작은 라마 4 모델들을 위한 "교사용 모델" 역할을 합니다

베헤모스는 현재 훈련 단계에 있으며 추후 출시될 예정입니다.

기술 혁신

Llama 4 모델 시리즈는 성능과 효율성을 향상시키는 몇 가지 중요한 기술 혁신을 도입했습니다

전문가 혼합형(MoE) 아키텍처

Llama 4의 가장 중요한 혁신 중 하나는 전문가 혼합(MoE) 아키텍처로, 각 토큰에 대해 모델 매개변수의 일부만 활성화됩니다

  • 이를 통해 높은 성능을 유지하면서도 계산 노력과 지연 시간을 크게 줄일 수 있습니다
  • Llama 4 Maverick에서는 각 토큰이 공유 전문가와 128개의 라우팅된 전문가 중 하나에 의해 처리됩니다
  • 이러한 아키텍처를 통해 추론 비용을 증가시키지 않고도 모델의 전체 매개변수를 늘릴 수 있습니다

초기 융합을 통한 네이티브 멀티모달리티

Llama 4는 Early Fusion을 통해 네이티브 멀티모달리티를 지원하는 최초의 오픈형 모델입니다

  • 텍스트 및 이미지 토큰은 통합 모델 아키텍처에 통합됩니다
  • 이를 통해 대량의 텍스트, 이미지 및 비디오 데이터를 사용하여 공동 사전 학습이 가능합니다
  • 텍스트와 이미지에 대해 별도의 매개변수를 사용했던 Llama 3.2와 달리, Llama 4는 동일한 매개변수를 사용하여 두 가지 양식을 모두 기본적으로 이해합니다

매우 긴 컨텍스트 윈도우

Llama 4 Scout의 매우 긴 컨텍스트 창은 특히 인상적입니다

  • 1천만 개의 토큰을 보유한 이 모델은 현재 시판되는 대부분의 모델을 훨씬 능가합니다
  • 이를 통해 매우 긴 문서, 전체 코드베이스 또는 광범위한 대화를 처리할 수 있습니다
  • iRoPE 아키텍처(인터리브드 어텐션 레이어)가 이를 가능하게 합니다

새로운 훈련 방법

Meta는 Llama 4 훈련을 위해 여러 혁신적인 방법을 사용했습니다

  • MetaP: 모델의 핵심 하이퍼파라미터를 안정적으로 조정하는 기법
  • FP8 정밀도: 효율적인 학습을 위해 8비트 부동 소수점 숫자 사용
  • 공증류: 라마 4 베헤모스를 소형 모델 개발을 위한 교사 모델로 활용
  • 증폭 기능을 갖춘 완전 비동기식 온라인 학습: 대규모 학습을 위한 새로운 인프라

가용성 및 통합

Llama 4 모델은 다양한 플랫폼과 서비스를 통해 이용할 수 있습니다

다운로드 및 클라우드 제공업체

  • Scout 및 Maverick 모델은 Meta 또는 Hugging Face를 통해 직접 다운로드할 수 있습니다
  • 이러한 서비스는 다양한 클라우드 플랫폼을 통해서도 이용할 수 있습니다
    • 클라우드플레어 워커스 AI
    • Azure AI Foundry 및 Azure Databricks
    • 구글 클라우드의 버텍스 AI
    • 향후 며칠 내에 더 많은 파트너가 합류할 예정입니다

메타 제품으로의 통합

Meta는 이미 다양한 플랫폼에서 AI 비서를 Llama 4로 업데이트했습니다

  • WhatsApp, Messenger 및 Instagram Direct는 40개국에서 사용 가능합니다
  • Meta.AI 웹사이트
  • 하지만 현재 멀티모달 기능은 미국 내 영어 사용 사용자에게만 제공됩니다

이와 관련된 내용:

라이선스 및 논란

Meta Llama 4는 "오픈 소스"로 설명되지만, 라이선스에 몇 가지 제한 사항이 있어 논란을 불러일으켰습니다

라이선스 제한

Llama 4 커뮤니티 라이선스에는 다음과 같은 몇 가지 제한 사항이 있습니다

  • 월간 활성 사용자 수가 7억 명 이상인 기업은 Meta로부터 특별 라이선스를 받아야 합니다
  • EU 내 사용자 및 기업은 규제 요건으로 인해 해당 모델을 사용하거나 배포할 수 없는 것으로 보입니다
  • 파생 모델의 명명 및 출처 표기에 관한 요구 사항이 있습니다

“오픈 소스”에 대한 논쟁

Llama 4를 실제로 "오픈 소스"라고 불러야 하는지에 대한 논쟁이 있습니다

  • 오픈 소스 이니셔티브는 2023년에 Llama 라이선스의 제한 사항으로 인해 Llama가 "오픈 소스" 범주에서 제외된다고 결정했습니다
  • 비평가들은 이것이 진정한 오픈 소스 소프트웨어라기보다는 "소스 오픈" 또는 "오픈 웨이트" 모델에 가깝다고 주장합니다
  • 라이선스 제한은 자체 법무팀이 없는 소규모 기업에게 문제가 될 수 있습니다

향후 계획

메타는 이미 라마 4와 그 이후의 계획에 대해 몇 가지 단서를 제공했습니다

라마콘 및 기타 공지사항

  • Meta는 2025년 4월 29일에 첫 번째 LlamaCon 컨퍼런스를 개최하여 AI 모델 및 제품 계획에 대한 자세한 내용을 발표할 예정입니다
  • 또한, 해당 회사는 2분기에 메타 챗봇 전용 애플리케이션을 출시할 계획입니다

언어 능력 향상

  • Meta는 Llama 4의 언어 능력을 향상시켜 더욱 자연스러운 대화를 가능하게 하기 위해 노력하고 있습니다
  • 목표는 사용자가 AI 모델의 대화를 중단할 수 있는 보다 원활한 양방향 대화를 가능하게 하는 것입니다
  • Meta의 최고 제품 책임자인 크리스 콕스는 곧 출시될 Llama 4를 음성을 텍스트로 변환하는 대신 모국어를 지원하는 "옴니 모델"이라고 설명했습니다

에이전트형 AI 및 향상된 기능

  • 마크 저커버그는 라마 4에 새로운 사용 사례를 가능하게 하는 "에이전트 기능"이 탑재될 것이라고 발표했습니다
  • Meta는 "일반적인 행동을 수행하고, 인간과 자연스럽게 소통하며, 어려운 문제를 해결할 수 있는" AI 모델을 개발하는 것을 목표로 합니다
  • 해당 회사는 예약이나 영상 제작과 같은 상담원 관련 용도로 자사 AI 비서에 대한 프리미엄 구독 서비스를 제공하는 방안을 검토 중입니다

라마 4가 AI 업계의 전환점이 되는 이유는 무엇일까요?

Llama 4의 출시는 경쟁이 치열한 생성형 AI 분야에서 선두주자가 되기 위한 Meta의 전략에 있어 중요한 진전입니다. Mixture of Experts 아키텍처, 네이티브 멀티모달리티, 그리고 인상적으로 긴 컨텍스트 윈도우를 도입함으로써 Meta는 오픈 소스 모델이 주요 기술 기업의 독점 모델과 경쟁할 수 있음을 입증했습니다.

라이선스 문제와 Llama 4를 진정한 의미의 "오픈 소스"라고 부를 수 있는지에 대한 논란에도 불구하고, 기술적 발전은 중요한 이정표가 됩니다. 텍스트와 이미지를 모두 처리할 수 있는 모델의 능력은 개발자와 기업에게 새로운 가능성을 열어줍니다.

Llama 4 Behemoth 출시가 아직 진행 중이고, 향상된 언어 및 에이전트 기능에 대한 계획이 발표된 것을 보면 Meta가 AI에 대한 투자를 더욱 강화할 것이 분명합니다. 앞으로 몇 달 동안 이러한 새로운 모델들이 AI 환경을 어떻게 변화시킬지, 그리고 마크 저커버그의 예측대로 오픈 소스 AI 모델이 인공지능의 주도적인 역할을 하게 될지 여부가 드러날 것입니다.

이와 관련된 내용:

 

귀사의 글로벌 마케팅 및 사업 개발 파트너

☑️ 저희 업무 언어는 영어 또는 독일어입니다

☑️ 신규 기능: 모국어로 소통하세요!

 

Konrad Wolfenstein

저와 저희 팀은 여러분의 개인 자문가로서 기꺼이 도움을 드릴 준비가 되어 있습니다.

여기 있는 문의 양식을 작성 wolfenstein@xpert.digital.하시거나 +49 7348 4088 965 로 전화 주시면 연락 드리겠습니다. 제 이메일 주소는 입니다

저는 우리의 공동 프로젝트를 기대하고 있습니다.

 

 

☑️ 중소기업의 전략, 컨설팅, 기획 및 실행 지원

☑️ 디지털 전략 수립 또는 재정비 및 디지털화

☑️ 해외 영업 프로세스 확장 및 최적화

☑️ 글로벌 및 디지털 B2B 거래 플랫폼

☑️ 선구적인 사업 개발/마케팅/홍보/박람회

모바일 버전을 종료하세요