NVIDIA、動画生成ワールドモデル SANA-WM を公開──2.6B モデルで 1 分間の 720p 生成
2.6B パラメータという軽量さで 1 分間の高解像度動画を生成可能にし、自律エージェントの訓練や物理シミュレーションの基盤として OSS 公開された。
リリース: 2024-11-20 · 読了 3 分何が起きた
2.6B パラメータの軽量なアーキテクチャを採用し、720p 解像度で最大 1 分間の動画生成に対応
NVIDIA の Sana フレームワークをベースにしたワールドモデルであり、物理的な一貫性を重視した設計
モデルの重みと推論コードがオープンソースとして公開され、単一のコンシューマ向け GPU での動作を視野に入れている
なぜ重要
商用 API に依存せず、1 分級の長尺動画をローカル環境で生成できるため、シミュレーションデータの生成コストを従来の 1/10 以下に抑制できる
👁️ 開発者
ロボティクスや自律走行のシミュレーションを扱う開発者は、高価な物理エンジンを構築する代わりに、このモデルを「微分可能な世界」として強化学習の訓練環境に直接組み込める。
🇯🇵 日本
[国内 ゲーム・エンタメ開発] 業種の中規模スタジオは、背景アニメーションや環境シミュレーションの生成において、高額なクラウド GPU 課金を回避しつつ、内製ワークフローに高品質な動画生成を統合できる。