🧠 research

2026-04-24 · 12 topics

DeepSeek V4: フロンティア級の性能を圧倒的低コストで実現

DeepSeek が 1M トークンコンテキスト対応の V4-Pro / V4-Flash をリリース

Google Cloud、エージェント特化型 TPU 8i と学習最適化 TPU 8t を発表

自律型 AI エージェントの推論・計画実行を高速化する TPU 8i と、大規模モデル学習用の TPU 8t を投入し、次世代 AI インフラを強化する。

Anthropic、RLHF 用データセット「hh-rlhf」を公開──AI の安全性と有用性を最適化

AI モデルの RLHF（人間からのフィードバックによる強化学習）の学習に不可欠な、安全性と有用性のトレードオフを評価するための対話データセット。

Hugging Face、MTEB リーダーボードを更新──テキスト埋め込みモデルの性能評価を網羅

膨大なテキスト埋め込みモデルの検索、分類、クラスタリング性能を統一指標で比較可能にする Hugging Face の主要なベンチマーク。

Mango — 全体視点最適化によるマルチエージェント Web ナビゲーション

Web サイト構造の全体最適化で探索効率を向上（原題: Mango: Multi-Agent Web Navigation via Global-View Optimization）

Google DeepMind、Decoupled DiLoCo を発表──地理的分散環境で従来比 20 倍以上の学習効率を実現

インターネット帯域での分散学習を可能にし、TPU v6e や v5p など異なる世代のハードウェアを混在させた大規模モデルの並列学習を実現する（原題: Decoupled DiLoCo: Resilient, Distributed AI Training at Scale）

GPT-5.5 システムカードを公開

OpenAIが公開した次世代モデルの安全性評価とリスク対策の技術詳細

MATRAG — 説明可能な推薦のためのマルチエージェント透明 RAG

マルチエージェント連携と知識グラフによる説明可能な推薦システム（原題: MATRAG: Multi-Agent Transparent Retrieval-Augmented Generation for Explainable Recommendations）

深層学習の科学的理論の構築へ──学習の力学（Learning Mechanics）という新たな枠組みの提唱

深層学習の学習過程を記述する5つの主要な研究領域を統合し、検証可能な定量的予測を可能にする新たな理論体系を提示。（原題: There Will Be a Scientific Theory of Deep Learning）

NVIDIA Jetson Orin Nano で Gemma 4 VLA を実行──エッジデバイスでの自律的な視覚推論を実現

8GBメモリのJetson環境で、Webカメラ入力と音声対話を統合したVLA（Vision-Language-Action）デモが動作可能に。

事前学習済みモデルを微調整せずにデータ拡張への不変性を付与する軽量アダプター

軽量なMLPアダプターと新たな損失関数により、元の特徴量を保持したまま回転やノイズに対する頑健性を向上。STL10で回転画像精度を71%から94%へ改善。（原題: Post-Training Augmentation Invariance）

Googleの最新世代TPUが121エクサフロップスの計算能力を達成

AI特化型プロセッサが帯域幅を倍増させ、大規模AIワークロードの処理を加速