批归一化成为深度学习架构中最普遍的组件之一。在 2010 年代后期,它在卷积网络中几乎被普遍采用,并且在许多架构中仍是标准做法。该技术的成功催生了一系列归一化方法,包括层归一化(在 Transformer 和循环网络中更受青睐)、实例归一化(用于风格迁移)以及组归一化(适用于小批量大小)。