研究:LLM の追従性を制御する「Cascading Linear Features」手法を公開
モデルの追従性(Sycophancy)を線形部分空間として分離・制御し、LLM-as-a-judge よりも低コストで高精度な挙動修正を実現する。