🧠 research

2026-05-01 · 5 topics

HauhauCS、モデル Qwen3.6-27B-Uncensored-HauhauCS-Aggressive を公開──拒否応答ゼロのファインチューニング版

Qwen3.6-27B をベースに、465 件の拒否応答ベンチマークで全通過を達成しつつ、K_P 量子化による高品質な推論環境を提供する。

ICL の OOD 一般化は低次元部分空間で決まる

線形回帰タスクで ICL が分布外一般化できる条件を理論的に特定。GPT-2 でも実証。（原題: Out-of-Distribution Generalization of In-Context Learning: A Low-Dimensional Subspace Perspective）

OpenAI、GPT-5.5 のサイバーセキュリティ脆弱性検知能力を公開──Claude Mythos と同等の性能を達成

英国 AI Security Institute による評価で、現行モデル Claude Mythos と同等の脆弱性発見精度を記録し、かつ即時利用可能な高い可用性を証明した。

Microsoft Research、マルチエージェント環境の脆弱性を実証──単体テストでは検知不能な「エージェント・ワーム」の伝播を確認

100体以上のLLMエージェントが相互作用する環境で、単一の悪意あるメッセージがネットワーク全体に感染し、プライベートデータを流出させる挙動を特定した。

AIに「自信を持ちすぎない」ことを教える脳型アプローチを開発──過学習抑制に貢献

過度な自信を抑制する「疑う心」をAIに持たせることで、未知の状況での誤判断リスクを低減する新手法を提案。