All translations
Enter a message name below to show all available translations.
Found 3 translations.
| Name | Current message text |
|---|---|
| h English (en) | * '''Too large''' — the iterates oscillate or diverge. * '''Too small''' — {{Term|convergence}} is unacceptably slow. * '''{{Term|learning rate}} schedules''' — many practitioners start with a larger rate and reduce it over time ({{Term|step decay}}, {{Term|exponential decay}}, {{Term|cosine annealing}}). * '''{{Term|line search}}''' — classical numerical methods choose <math>\eta</math> at each {{Term|training step|step}} to satisfy conditions such as the Wolfe or Armijo conditions, though this is rare in {{Term|deep learning}}. |
| h Spanish (es) | * '''Demasiado grande''' — los iterados oscilan o divergen. * '''Demasiado pequeña''' — la {{Term|convergence|convergencia}} es inaceptablemente lenta. * '''Programaciones de la {{Term|learning rate|tasa de aprendizaje}}''' — muchos profesionales empiezan con una tasa más alta y la reducen con el tiempo ({{Term|step decay|decaimiento por pasos}}, {{Term|exponential decay|decaimiento exponencial}}, {{Term|cosine annealing|recocido coseno}}). * '''{{Term|line search|Búsqueda en línea}}''' — los métodos numéricos clásicos eligen <math>\eta</math> en cada {{Term|training step|paso}} para satisfacer condiciones como las de Wolfe o Armijo, aunque esto es poco frecuente en el {{Term|deep learning|aprendizaje profundo}}. |
| h Chinese (zh) | * '''过大''' — 迭代会振荡或发散。 * '''过小''' — {{Term|convergence|收敛}}速度慢得难以接受。 * '''{{Term|learning rate|学习率}}调度''' — 许多从业者从较大的学习率开始,并随时间降低({{Term|step decay|阶梯衰减}}、{{Term|exponential decay|指数衰减}}、{{Term|cosine annealing|余弦退火}})。 * '''{{Term|line search|线搜索}}''' — 经典数值方法在每{{Term|training step|步}}选择 <math>\eta</math> 以满足 Wolfe 或 Armijo 等条件,但在{{Term|deep learning|深度学习}}中很少使用。 |