LoRA学習への指数移動平均（EMA）導入によりLLM微調整の汎化性能と安定性が向上

📜Papers🔥

LoRAの重み更新にEMAを適用する手法を提案。数学推論やドメイン適応において、標準的なLoRAを上回る精度を達成。（原題: LoRA-EMA: Exponential Moving Average for Low-Rank Adaptation）

リリース: 2025-01-10 · 読了 3 分

何が起きた

なぜ重要

LoRA微調整において「最終ステップの重みが最適とは限らない」という課題に対し、計算負荷をほぼ増やさずにロバストなモデルを得る手法が確立された。検証データでのスコア変動に悩む開発者にとって、チェックポイント選択の不確実性を排除できる。

👁️ 開発者

LoRAで微調整を行う際は、実装に数行加えるだけで性能向上が見込めるEMAを導入すべき。特に小規模データセットでの過学習抑制や、学習曲線が不安定なタスクで最も効果を発揮する。

🇯🇵 日本

国内固有の追加文脈は限定的（汎用的に有用）。

著者

Ying-Hsin Chen · National Taiwan University

Hung-yi Lee · National Taiwan University

📊 Benchmark

Metric	Score	Δ
GSM8K (Llama-3-8B)	38.5	+2.1
GLUE Average	84.2	+0.7