🧠 research

2026-06-08 · 5 topics

DeepSeek-V3 は MoE と FP8 訓練で学習効率を極限まで追求──H100 換算 2.7M 時間で SOTA 級へ

671B パラメータの MoE 構成とマルチトークン予測を採用。推論コストを抑えつつ GPT-4o 級の性能を実現。（原題: DeepSeek-V3 Technical Report）

研究チーム、エージェント型開発のトークン消費を分析──コードレビューが 59.4% を占めると判明

ChatDev と GPT-5 を用いた 30 件のタスク分析により、自動開発コストの 6 割が反復的なレビューに集中し、入力トークンの冗長性がボトルネックであることを実証した。

Cohere、未発表のコーディング特化モデルを Reddit コミュニティ限定で先行公開

プログラミング性能を極限まで高めた次世代モデルのアーリーアクセスを、LocalLLaMA の開発者層に向けて開放。

LLM の擬人化属性を批判する研究──Age of Empires II も同様の属性を持ち得ると証明

LLM に道徳や理解といった人間的属性を認める議論に対し、AoE2 のような基底でも同様の振る舞いが再現可能であることを示し、評価基準の厳密化を提唱。

Nature Machine Intelligence への投稿・査読プロセスの実態──トップジャーナルの評価と採択の壁

機械学習トップジャーナル NMI の査読期間や編集方針に関するコミュニティの知見。研究の社会的インパクト重視の傾向。（原題: Anyone here with experience submitting to Nature Machine Intelligence?）