All translations
Enter a message name below to show all available translations.
Found 3 translations.
| Name | Current message text |
|---|---|
| h English (en) | The scaling factor <math>\sqrt{d_k}</math> prevents the dot products from growing large in magnitude as the key dimension <math>d_k</math> increases, which would push the softmax into regions of extremely small gradients. |
| h Spanish (es) | El factor de escala <math>\sqrt{d_k}</math> evita que los productos punto crezcan en magnitud a medida que aumenta la dimensión de la clave <math>d_k</math>, lo cual llevaría al softmax a regiones con gradientes extremadamente pequeños. |
| h Chinese (zh) | 缩放因子 <math>\sqrt{d_k}</math> 防止点积在键维度 <math>d_k</math> 增大时数值过大,否则会使 softmax 进入梯度极小的区域。 |