ResNet の学習ダイナミクスを解明──Wasserstein 空間上の測地線を学習する数学的根拠を提示
ResNet がなぜ深層化しても最適化可能で高い汎化性能を持つのかを、連続方程式を用いた最適輸送理論の観点から数学的に証明した。