Translations:Attention Mechanisms/27/zh

    From Marovi AI

    由于自注意力是置换不变的(它将输入视为无序集合),位置信息必须显式注入。原始 Transformer 使用正弦编码: