Translations:Attention Mechanisms/15/zh: Difference between revisions
(Batch translate Attention Mechanisms unit 15 → zh) Tag: translation |
(Batch translate Attention Mechanisms unit 15 → zh) Tag: translation |
||
| Line 1: | Line 1: | ||
Vaswani 等人(2017)提出了 Transformer 中使用的公式。给定查询矩阵 <math>Q</math>、键矩阵 <math>K</math> 和值矩阵 <math>V</math>: | Vaswani 等人 (2017) 提出了 Transformer 中使用的公式。给定查询矩阵 <math>Q</math>、键矩阵 <math>K</math> 和值矩阵 <math>V</math>: | ||
Revision as of 21:58, 27 April 2026
Vaswani 等人 (2017) 提出了 Transformer 中使用的公式。给定查询矩阵 $ Q $、键矩阵 $ K $ 和值矩阵 $ V $: