ウェブサイトアイコン Xpert.Digital

中国の大規模なビデオ AI 攻勢: アリババは Wan 2.2 で西側諸国を追い抜くことを目指し、すべてをオープンソース化しています。

中国の大規模な AI 攻勢: アリババは Wan 2.2 で西側諸国を追い抜くことを目指し、すべてをオープンソース化しています。

中国のAI大攻勢:アリババはWan 2.2で西側諸国を追い抜くことを目指し、すべてをオープンソース化しようとしている – 画像:Xpert.Digital

これは Alibaba の新しい驚異の AI Wan2.2 です。無料で、競合製品よりも強力で、誰でも利用できます。

OpenAI の Sora に対する中国のビデオ回答: この新しい AI は映画品質のビデオを生成しますが、無料です。

2025年7月29日、中国のテクノロジー企業アリババは、オープンソース動画生成モデルの画期的な新バージョンであるWan2.2をリリースしました。これは、動画制作における人工知能の状況を根本的に変えるものです。この革新的な技術は、Mixture-of-Experts(MoE)アーキテクチャを実装した世界初のオープンソース動画生成モデルであり、プロの映画制作と市販ハードウェアでの使用の両方を想定して設計されています。.

これに関連して:

MoEアーキテクチャによる技術革命

Wan2.2は、ビデオ拡散モデルに初めてエキスパート混合アーキテクチャを導入し、大きな技術的ブレークスルーをもたらします。この革新的なアーキテクチャは、ビデオ生成プロセスを2つの専門段階に分割するデュアルエキスパートシステムを採用しています。最初のエキスパートはノイズ低減の初期段階に焦点を当て、基本的なシーンレイアウトを決定し、2番目のエキスパートは後期段階を担当し、ディテールとテクスチャを調整します。.

このシステムは合計270億個のパラメータを有しますが、推論ステップごとに140億個のパラメータのみをアクティブ化することで、品質を損なうことなく計算量を最大50%削減します。この効率性の向上により、計算コストを一定に保ちながら、モデル全体の容量を拡大しながら高品質な動画を生成することが可能になります。.

映画の美学と映画のコントロール

Wan2.2の際立った特徴は、映画的な美的コントロールシステムです。これにより、ユーザーは様々な視覚的次元を正確に制御できます。このモデルは、照明、構図、コントラスト、色相、カメラアングル、画像サイズ、焦点距離、その他の映画的パラメータの詳細なラベルを含む、厳選された美的データに基づいてトレーニングされています。.

この機能は、照明、照明効果、構図、色彩といった主要な要素を分類する、映画に着想を得たプロンプトシステムに基づいています。これにより、Wan2.2は生成プロセスにおいてユーザーの美的意図を正確に解釈・実現し、カスタマイズ可能な映画的な設定を備えた動画の作成を可能にします。.

高度なトレーニングデータと複雑なモーション生成

前身のWan2.1と比較して、トレーニングデータセットが大幅に拡張され、画像データは65.6%、動画データは83.2%増加しました。この大規模なデータ拡張により、モデルの汎化能力が大幅に向上し、動き、セマンティクス、美的感覚など、複数の次元における創造性の多様性が向上します。.

このモデルは、リアルな表情、ダイナミックな手振り、複雑な運動動作など、複雑な動作の生成において大幅な改善を示しています。さらに、コマンドへの従順性と物理法則への適合性が向上し、より自然で説得力のある動画シーケンスを実現しました。.

効率的なハードウェア利用とアクセシビリティ

Wan2.2 は、さまざまな要件とハードウェア構成に対応する 3 つの異なるモデル バリアントを提供します。

  • Wan2.2-T2V-A14B: 270 億のパラメータ (140 億がアクティブ) を持つテキストからビデオへのモデルで、720p の解像度と 16fps でビデオを生成します。.
  • Wan2.2-I2V-A14B: 静止画像をビデオに変換するための同じアーキテクチャを備えた画像からビデオへのモデル。.
  • Wan2.2-TI2V-5B: テキストからビデオへの変換機能と画像からビデオへの変換機能を統合した、コンパクトな 50 億パラメータ モデルです。.

コンパクトな TI2V-5B モデルは、RTX 4090 などの単一のコンシューマー GPU で 9 分未満で 5 秒間の 720p ビデオを生成できるため、大きな進歩を表しています。この速度により、TI2V-5B は市販されている最速の 720p@24fps モデルの 1 つとなり、産業用アプリケーションと学術研究の両方でこのテクノロジのメリットを享受できるようになります。.

最適化された圧縮を実現する高度なUAEアーキテクチャ

TI2V-5B モデルは、圧縮率が 4×16×16 の高効率 3D VAE アーキテクチャをベースとしており、全体的な情報圧縮率が 64 に向上します。パッチ レイヤーを追加することで、TI2V-5B の全体的な圧縮率は 4×32×32 にまで達し、最小限のストレージ要件で高品質のビデオ再構築を保証します。.

この高度な圧縮技術により、モデルは単一の統合フレームワークでテキストからビデオへのタスクと画像からビデオへのタスクの両方をネイティブにサポートできるようになり、学術研究と実際のアプリケーションの両方をカバーします。.

ベンチマークパフォーマンスと市場ポジション

Wan2.2は、新しいWan-Bench 2.0評価スイートを用いて、Sora、KLING 2.0、Hailuo 02などの主要な商用AIビデオ生成モデルと比較テストされました。その結果、Wan2.2はほとんどのカテゴリで最先端の性能を達成し、上位の競合モデルを凌駕することが示されました。.

直接的なランキング比較において、Wan2.2-T2V-A14Bは、美観品質とモーションダイナミクスといった重要な領域を含む、6つの主要ベンチマーク項目のうち4項目で1位を獲得しました。この成果により、Wan2.2は高解像度ビデオ生成における新たなオープンソース市場リーダーとしての地位を確立しました。.

オープンソースの可用性と統合

Wan2.2はApache 2.0ライセンスに基づく完全なオープンソースソフトウェアとして提供されており、Hugging Face、GitHub、ModelScopeからダウンロードできます。モデルはComfyUIやDiffusersなどの一般的なフレームワークに既に統合されており、既存のワークフローでシームレスに利用できます。.

TI2V-5Bモデルは、すぐに使えるHugging Face Spaceを搭載しており、複雑なインストール作業なしにすぐに技術を試すことができます。このアクセシビリティにより、最先端のビデオ生成技術へのアクセスが民主化され、開発者コミュニティ全体のイノベーションが促進されます。.

中国の戦略的AI攻勢

Wan2.2のリリースは、DeepSeekなどのモデルによって既に国際的な注目を集めている、中国のより広範なオープンソースAI戦略の一環です。この戦略は、2018年以降、オープンソースのコラボレーションを国家資源として推進し、AIインフラへの政府による大規模な投資を想定している中国の公式デジタル化計画と整合しています。.

アリババは、Hugging FaceとModelScopeにおけるWANモデルのダウンロード数が既に540万回を超えており、中国のオープンソースAIソリューションに対する国際的な需要の強さを裏付けています。同社は、この急成長市場における地位を確固たるものにするため、クラウドコンピューティングとAIインフラに約520億ドルの投資を計画しています。.

これに関連して:

Wan2.2 は AI ビデオに画期的な進歩をもたらします: プロフェッショナル レベルのオープン ソースです。

Wan2.2はAI動画生成における転換点であり、商用ソリューションに匹敵する有料のプロプライエタリモデルに代わる、初めてのオープンソースモデルを提供します。映画のような高画質、効率的なハードウェア利用、そして完全なオープンソースという組み合わせにより、このモデルは世界中のコンテンツクリエイター、映画制作者、そして開発者にとって魅力的な選択肢となります。.

このリリースは、AIを活用した動画生成分野における競争を激化させる可能性があり、他の企業が同様のオープンソース戦略を追求するきっかけとなる可能性があります。Wan2.2は、コンシューマー向けハードウェアで動作し、プロフェッショナルな成果を提供できるため、動画制作を民主化し、新たな創造の可能性を解き放つ可能性を秘めています。.

先進技術とオープンな開発理念を組み合わせることで、アリババはWan2.2によってAI動画生成における新たな基準を確立し、中国を世界のAIイノベーションの牽引役として確立しようとしています。この開発の広範な影響は、今後数年間の動画制作の方法を根本的に変えるでしょう。.

これに関連して:

 

AI変革、AI統合、AIプラットフォーム業界の専門家

☑️ 当社のビジネス言語は英語またはドイツ語です。

☑️ 新機能: 母国語での対応!

 

Konrad Wolfenstein

私と私のチームは、あなたの個人アドバイザーとして喜んでお手伝いさせていただきます。.

こちらの問い合わせフォームにご記入いただくか までお電話ください +49 7348 4088 965 メールアドレスは wolfenstein@xpert.digital

私たちの共同プロジェクトを楽しみにしています。.

 

 

☑️ 戦略、コンサルティング、計画、実装における中小企業のサポート

☑️ AI戦略の策定または再調整

☑️ パイオニア事業開発

モバイル版を離れる