All translations

Enter a message name below to show all available translations.

Message

Found 3 translations.

NameCurrent message text
 h English (en)A common heuristic is to use a {{Term|learning rate}} 10–100x smaller for pretrained layers than for the new classification head, preventing catastrophic forgetting of learned representations.
 h Spanish (es)Una heurística común es usar una {{Term|learning rate|tasa de aprendizaje}} de 10 a 100 veces menor para las capas preentrenadas que para la nueva cabeza de clasificación, evitando el olvido catastrófico de las representaciones aprendidas.
 h Chinese (zh)一种常见的经验法则是为预训练层使用比新分类头小 10–100 倍的{{Term|learning rate|学习率}},从而防止已学习表示的灾难性遗忘。