批歸一化也影響了從業者對網絡設計的思考方式。通過穩定訓練動力學,它使超參數搜索更具容錯性,並鼓勵了更深、更寬架構的發展。該技術與其他組件——學習率、權重初始化和正則化——的相互作用仍是一個活躍的研究領域。