2026-04-24 · 12 topics
DeepSeek V4: フロンティア級の性能を圧倒的低コストで実現
🔥🔥🔥DeepSeek が 1M トークンコンテキスト対応の V4-Pro / V4-Flash をリリース
Google Cloud、エージェント特化型 TPU 8i と学習最適化 TPU 8t を発表
🔥🔥🔥自律型 AI エージェントの推論・計画実行を高速化する TPU 8i と、大規模モデル学習用の TPU 8t を投入し、次世代 AI インフラを強化する。
Anthropic、RLHF 用データセット「hh-rlhf」を公開──AI の安全性と有用性を最適化
🔥🔥AI モデルの RLHF(人間からのフィードバックによる強化学習)の学習に不可欠な、安全性と有用性のトレードオフを評価するための対話データセット。
Hugging Face、MTEB リーダーボードを更新──テキスト埋め込みモデルの性能評価を網羅
🔥🔥膨大なテキスト埋め込みモデルの検索、分類、クラスタリング性能を統一指標で比較可能にする Hugging Face の主要なベンチマーク。
Mango — 全体視点最適化によるマルチエージェント Web ナビゲーション
🔥🔥Web サイト構造の全体最適化で探索効率を向上(原題: Mango: Multi-Agent Web Navigation via Global-View Optimization)
Google DeepMind、Decoupled DiLoCo を発表──地理的分散環境で従来比 20 倍以上の学習効率を実現
🔥🔥インターネット帯域での分散学習を可能にし、TPU v6e や v5p など異なる世代のハードウェアを混在させた大規模モデルの並列学習を実現する(原題: Decoupled DiLoCo: Resilient, Distributed AI Training at Scale)
GPT-5.5 システムカードを公開
🔥🔥OpenAIが公開した次世代モデルの安全性評価とリスク対策の技術詳細
MATRAG — 説明可能な推薦のためのマルチエージェント透明 RAG
🔥🔥マルチエージェント連携と知識グラフによる説明可能な推薦システム(原題: MATRAG: Multi-Agent Transparent Retrieval-Augmented Generation for Explainable Recommendations)
深層学習の科学的理論の構築へ──学習の力学(Learning Mechanics)という新たな枠組みの提唱
🔥🔥深層学習の学習過程を記述する5つの主要な研究領域を統合し、検証可能な定量的予測を可能にする新たな理論体系を提示。(原題: There Will Be a Scientific Theory of Deep Learning)
NVIDIA Jetson Orin Nano で Gemma 4 VLA を実行──エッジデバイスでの自律的な視覚推論を実現
🔥🔥8GBメモリのJetson環境で、Webカメラ入力と音声対話を統合したVLA(Vision-Language-Action)デモが動作可能に。
事前学習済みモデルを微調整せずにデータ拡張への不変性を付与する軽量アダプター
🔥軽量なMLPアダプターと新たな損失関数により、元の特徴量を保持したまま回転やノイズに対する頑健性を向上。STL10で回転画像精度を71%から94%へ改善。(原題: Post-Training Augmentation Invariance)
Googleの最新世代TPUが121エクサフロップスの計算能力を達成
🔥AI特化型プロセッサが帯域幅を倍増させ、大規模AIワークロードの処理を加速