Translations:Batch Normalization Accelerating Deep Network Training/17/zh

    From Marovi AI

    作者还观察到,批归一化降低了对精确初始化的依赖,允许使用更高的学习率而不发散,并提供了轻微的正则化效果,因为每个样本的归一化值取决于其小批量中的其他样本,从而引入了随机噪声。