Translations:Batch Normalization Accelerating Deep Network Training/24/zh

尽管最初关于内部协变量偏移的解释一直存在争议——Santurkar 等人（2018）的后续工作认为主要的益处来自于平滑优化景观，而不是减少分布偏移——但批归一化的实际有效性是无可争议的。它是训练深度网络的关键推动者，这些深度网络推动了 2010 年代计算机视觉领域的进步。