🧠 research
2026-06-08 · 5 topics
DeepSeek-V3 は MoE と FP8 訓練で学習効率を極限まで追求──H100 換算 2.7M 時間で SOTA 級へ
🔥🔥🔥671B パラメータの MoE 構成とマルチトークン予測を採用。推論コストを抑えつつ GPT-4o 級の性能を実現。(原題: DeepSeek-V3 Technical Report)
研究チーム、エージェント型開発のトークン消費を分析──コードレビューが 59.4% を占めると判明
🔥🔥ChatDev と GPT-5 を用いた 30 件のタスク分析により、自動開発コストの 6 割が反復的なレビューに集中し、入力トークンの冗長性がボトルネックであることを実証した。
Cohere、未発表のコーディング特化モデルを Reddit コミュニティ限定で先行公開
🔥🔥プログラミング性能を極限まで高めた次世代モデルのアーリーアクセスを、LocalLLaMA の開発者層に向けて開放。
LLM の擬人化属性を批判する研究──Age of Empires II も同様の属性を持ち得ると証明
🔥LLM に道徳や理解といった人間的属性を認める議論に対し、AoE2 のような基底でも同様の振る舞いが再現可能であることを示し、評価基準の厳密化を提唱。
Nature Machine Intelligence への投稿・査読プロセスの実態──トップジャーナルの評価と採択の壁
🔥機械学習トップジャーナル NMI の査読期間や編集方針に関するコミュニティの知見。研究の社会的インパクト重視の傾向。(原題: Anyone here with experience submitting to Nature Machine Intelligence?)