All translations

Enter a message name below to show all available translations.

Message

Found 3 translations.

NameCurrent message text
 h English (en)The scaling factor <math>\sqrt{d_k}</math> prevents the dot products from growing large in magnitude as the key dimension <math>d_k</math> increases, which would push the softmax into regions of extremely small gradients.
 h Spanish (es)El factor de escala <math>\sqrt{d_k}</math> evita que los productos punto crezcan en magnitud a medida que aumenta la dimensión de la clave <math>d_k</math>, lo cual llevaría al softmax a regiones con gradientes extremadamente pequeños.
 h Chinese (zh)缩放因子 <math>\sqrt{d_k}</math> 防止点积在键维度 <math>d_k</math> 增大时数值过大,否则会使 softmax 进入梯度极小的区域。