Latest Issue · 2026年6月8日 (月)
DeepSeek-V3 は MoE と FP8 訓練で学習効率を極限まで追求──H100 換算 2.7M 時間で SOTA 級へ
671B パラメータの MoE 構成とマルチトークン予測を採用。推論コストを抑えつつ GPT-4o 級の性能を実現。(原題: DeepSeek-V3 Technical Report)
Hot·11 topics · 42 min
今日のダイジェストを読む →Recent issues
Browse by category
Research
203 topics
LLM
MoE
NVIDIA
DeepSeek-V3 は MoE と FP8 訓練で学習効率を極限まで追求──H100 換算 2.7M 時間で SOTA 級へ
Browse Research →Papers
39 topics
LLM
Transformer
Mechanistic Interpretability
マルチエージェント間の通信を「行動と状態」に構造化し、SWE-agent のトークン消費を 50% 削減
Browse Papers →Tools
205 topics
LLM
Hacker News
OSS
Jane Street、デザイナーのワークフロー変革を公開──Figma よりも AI エージェント Claude で直接プロトタイプを実装
Browse Tools →Product
102 topics
OpenAI
LLM
Gemini
NVIDIA、AI エージェント向けチップ「RTX Spark」を韓国で公開──DLSS 4.5 統合で 1440p 100FPS 超を達成
Browse Product →Trending tags
End of archive