Translations:Attention Mechanisms/31/zh

    From Marovi AI

    交叉注意力用于查询来自一个序列、键/值来自另一个序列的场景。在编码器-解码器Transformer中,解码器通过交叉注意力关注编码器的输出,使模型能够基于完整的输入上下文进行生成。