LLM 分散学習の並列構成を秒単位で動的変更──235B モデルの再構成を 1000 倍高速化
仮想パラメータ空間 (VPS) 抽象化により、学習を止めずに多次元並列レイアウトを高速切り替え。リソース変動や RLHF フェーズ移行に即応。(原題: DynaTrain: Fast Online Parallelism Switching for Elastic LLM Training)