尽管最初关于内部协变量偏移的解释一直存在争议——Santurkar 等人(2018)的后续工作认为主要的益处来自于平滑优化景观,而不是减少分布偏移——但批归一化的实际有效性是无可争议的。它是训练深度网络的关键推动者,这些深度网络推动了 2010 年代计算机视觉领域的进步。