All translations

Enter a message name below to show all available translations.

Message

Found 3 translations.

NameCurrent message text
 h English (en)* '''Too large''' — the iterates oscillate or diverge.
* '''Too small''' — {{Term|convergence}} is unacceptably slow.
* '''{{Term|learning rate}} schedules''' — many practitioners start with a larger rate and reduce it over time ({{Term|step decay}}, {{Term|exponential decay}}, {{Term|cosine annealing}}).
* '''{{Term|line search}}''' — classical numerical methods choose <math>\eta</math> at each {{Term|training step|step}} to satisfy conditions such as the Wolfe or Armijo conditions, though this is rare in {{Term|deep learning}}.
 h Spanish (es)* '''Demasiado grande''' — los iterados oscilan o divergen.
* '''Demasiado pequeña''' — la {{Term|convergence|convergencia}} es inaceptablemente lenta.
* '''Programaciones de la {{Term|learning rate|tasa de aprendizaje}}''' — muchos profesionales empiezan con una tasa más alta y la reducen con el tiempo ({{Term|step decay|decaimiento por pasos}}, {{Term|exponential decay|decaimiento exponencial}}, {{Term|cosine annealing|recocido coseno}}).
* '''{{Term|line search|Búsqueda en línea}}''' — los métodos numéricos clásicos eligen <math>\eta</math> en cada {{Term|training step|paso}} para satisfacer condiciones como las de Wolfe o Armijo, aunque esto es poco frecuente en el {{Term|deep learning|aprendizaje profundo}}.
 h Chinese (zh)* '''过大''' — 迭代会振荡或发散。
* '''过小''' — {{Term|convergence|收敛}}速度慢得难以接受。
* '''{{Term|learning rate|学习率}}调度''' — 许多从业者从较大的学习率开始,并随时间降低({{Term|step decay|阶梯衰减}}、{{Term|exponential decay|指数衰减}}、{{Term|cosine annealing|余弦退火}})。
* '''{{Term|line search|线搜索}}''' — 经典数值方法在每{{Term|training step|步}}选择 <math>\eta</math> 以满足 Wolfe 或 Armijo 等条件,但在{{Term|deep learning|深度学习}}中很少使用。