All translations
Enter a message name below to show all available translations.
Found 3 translations.
| Name | Current message text |
|---|---|
| h English (en) | The first moment estimate provides {{Term|momentum}}-like behavior, accelerating {{Term|convergence}} along consistent gradient directions. The second moment estimate scales the {{Term|learning rate}} inversely with the root-mean-square of recent gradients, giving each parameter its own effective {{Term|learning rate}}. The combination means parameters with consistently large gradients receive smaller updates, while parameters with small or noisy gradients receive relatively larger updates. |
| h Spanish (es) | La estimación del primer momento proporciona un comportamiento similar al {{Term|momentum|momentum}}, acelerando la {{Term|convergence|convergencia}} en direcciones de gradiente consistentes. La estimación del segundo momento escala la {{Term|learning rate|tasa de aprendizaje}} de forma inversamente proporcional a la raíz cuadrática media de los gradientes recientes, otorgando a cada parámetro su propia {{Term|learning rate|tasa de aprendizaje}} efectiva. La combinación implica que los parámetros con gradientes consistentemente grandes reciben actualizaciones más pequeñas, mientras que los parámetros con gradientes pequeños o ruidosos reciben actualizaciones relativamente mayores. |
| h Chinese (zh) | 一阶矩估计提供了类似 {{Term|momentum|动量}} 的行为,能够沿着方向一致的梯度加速 {{Term|convergence|收敛}}。二阶矩估计将 {{Term|learning rate|学习率}} 与近期梯度的均方根成反比缩放,使每个参数获得各自有效的 {{Term|learning rate|学习率}}。这种组合意味着梯度持续较大的参数获得较小的更新,而梯度较小或噪声较大的参数则获得相对较大的更新。 |