Translations:Attention Mechanisms/27/zh

    From Marovi AI

    由於自注意力是置換不變的(它將輸入視為無序集合),位置信息必須顯式注入。原始 Transformer 使用正弦編碼: