Translations:Gradient Descent/4/zh

    From Marovi AI

    每一步的大小由一个称为 学习率 的标量控制(通常记为 $ \eta $)。较大的 学习率 能快速覆盖范围,但有越过最小值的风险;较小的 学习率 收敛更为可靠,但可能需要过多的步数。