🧠 research

2026-06-20 · 5 topics

DeepSeek、1.6T パラメータの MoE モデル DeepSeek-V4 を発表──100万トークン時の KV キャッシュを 90% 削減

新開発のハイブリッドアテンション CSA/HCA により、1M トークンの超長文脈推論における KV キャッシュ消費を DeepSeek-V3.2 比で 1/10 に圧縮した。

Hugging Face、PEFT 手法の比較ベンチマークを公開──LoRA 以外の選択肢と性能・メモリのトレードオフを検証

LoRA が 98% のシェアを占める現状に対し、BEFT や Lily など 40 種以上の手法を同一条件で比較。精度と VRAM 使用量のパレート最適解を明らかにした。

OpenAI とボストン小児病院、小児希少疾患の診断支援 AI を共同開発──診断期間の劇的短縮を目指す

医師が数年を要する希少疾患の特定プロセスを、LLM による医学文献と症例データの統合解析により、数日単位へ短縮し早期治療介入を実現する試み。

Claude Opus 4.8 の品質劣化疑惑を多層検証──モデル重みは不変も周辺レイヤーで実効性能が低下か

API の model ID は固定 snapshot だが、serving infrastructure や Claude Code の推論設定変更により、6 月中旬以降、実効挙動の不安定化が報告されている。

不完全なリッフルシャッフルでも「カットオフ現象」が発生することを数学的に証明

1992年の『7回で混ざる』理論を拡張。厳密な等分割を伴わない現実的な操作でも、ある回数で急激に無秩序化する性質が証明された。