Notable3 min · LLM · MoE
JetBrains、12B MoE モデル Mellum2 を公開──推論速度 2 倍以上でコード・テキスト処理を高速化 トークンあたり 2.5B の活性化により、IDE 内の補完やエージェントのルーティングなど、低レイテンシが必須なソフトウェア開発工程を Apache 2.0 で効率化する。
The Facts JetBrains が開発した 12B パラメータの Mixture-of-Experts (MoE) モデルで、トークンあたりの活性化パラメータを 2.5B に抑えている。 同規模のオープンモデルと比較して 2 倍以上の推論速度を達成しており、高スループットなプロダクション環境への適用を主眼に置く。 Apache 2.0 ライセンスで公開され、Hugging Face からモデルウェイトのダウンロードおよび商用利用が可能。 コード生成や数学、推論などのベンチマークにおいて、同等サイズの既存モデルと競合する性能を維持しつつ、テキストとコードに特化している。 Why It Matters 「何でもできる巨大モデル」ではなく、IDE 補完や RAG の前処理といった「高頻度・低遅延」が求められる特定タスクの運用コストを劇的に下げられる。 Apache 2.0 かつ軽量なため、機密コードを扱う企業が自社インフラ内で SOTA 級のコード支援モデルを安価に運用する現実的な選択肢になる。 For Developers IDE 拡張機能や社内エージェントを開発するエンジニアは、これまで GPT-4o-mini 等で行っていたルーティングや要約タスクを、Mellum2 のローカルデプロイに置き換えることでレイテンシを半減できる。
For Japan [国内 AI ツール開発ベンダー] や [大手製造業の社内 DX 部門] は、プロプライエタリなコード資産を外部 API に送ることなく、オンプレミス環境で高速なコード生成・修正パイプラインを構築する基盤として活用できる。
Sources Notable5 min · Physical AI · Robotics
NVIDIA、物理 AI 向け統合モデル Cosmos 3 を公開──推論と行動を 1 パスで処理する MoT 採用 ロボティクスや自動運転に必要な「世界理解・推論・行動生成」を単一の Mixture-of-Transformers アーキテクチャで統合し、16B/64B の 2 サイズで提供される。
NVIDIA が物理 AI 向け基盤モデル Cosmos 3 を公開。16B (Nano) と 64B (Super) の 2 サイズ展開で、Hugging Face でオープン公開された。
詳細を読む ▾
Notable2 min · LLM · NVIDIA
NVIDIA、LLM モデル Nemotron 3 Ultra を発表──エンタープライズ RAG 性能を極限まで強化 NVIDIA の Nemotron 3 系列における最上位「Ultra」グレード。既存の 70B モデルを凌駕する推論精度を備え、企業独自のデータを用いた RAG パイプラインの最終回答品質を商用 API レベルへ引き上げる。
NVIDIA が Nemotron 3 ファミリーの最高峰となる「Ultra」モデルを正式発表。
詳細を読む ▾
Brief5 min · Hypersonic · Missile Defense
極超音速ミサイル迎撃の技術的限界──Mach 5超の熱化学的障壁と専用迎撃機の3年以上の空白 メディアが報じる「迎撃成功」の多くは準弾道ミサイルであり、真の極超音速滑空体(HGV)に対する有効な迎撃手段は2026年時点でも実戦配備されていない。
Mach 5(音速の5倍)を超えると空気の分子が解離し、流体力学ではなく「航空熱化学」の領域に移行する。
詳細を読む ▾