All translations

Enter a message name below to show all available translations.

Found 3 translations.

Name	Current message text
^h English (en)	The first moment estimate provides {{Term\|momentum}}-like behavior, accelerating {{Term\|convergence}} along consistent gradient directions. The second moment estimate scales the {{Term\|learning rate}} inversely with the root-mean-square of recent gradients, giving each parameter its own effective {{Term\|learning rate}}. The combination means parameters with consistently large gradients receive smaller updates, while parameters with small or noisy gradients receive relatively larger updates.
^h Spanish (es)	La estimación del primer momento proporciona un comportamiento similar al {{Term\|momentum\|momentum}}, acelerando la {{Term\|convergence\|convergencia}} en direcciones de gradiente consistentes. La estimación del segundo momento escala la {{Term\|learning rate\|tasa de aprendizaje}} de forma inversamente proporcional a la raíz cuadrática media de los gradientes recientes, otorgando a cada parámetro su propia {{Term\|learning rate\|tasa de aprendizaje}} efectiva. La combinación implica que los parámetros con gradientes consistentemente grandes reciben actualizaciones más pequeñas, mientras que los parámetros con gradientes pequeños o ruidosos reciben actualizaciones relativamente mayores.
^h Chinese (zh)	一阶矩估计提供了类似 {{Term\|momentum\|动量}} 的行为，能够沿着方向一致的梯度加速 {{Term\|convergence\|收敛}}。二阶矩估计将 {{Term\|learning rate\|学习率}} 与近期梯度的均方根成反比缩放，使每个参数获得各自有效的 {{Term\|learning rate\|学习率}}。这种组合意味着梯度持续较大的参数获得较小的更新，而梯度较小或噪声较大的参数则获得相对较大的更新。