Translations:Attention Mechanisms/1/zh
注意力机制是一类使神经网络在生成输出的每个元素时能够选择性地关注其输入相关部分的技术。注意力最初被提出是为了克服序列到序列模型中固定长度上下文向量的局限性,如今已成为Transformer等现代架构的基础构建模块。
注意力机制是一类使神经网络在生成输出的每个元素时能够选择性地关注其输入相关部分的技术。注意力最初被提出是为了克服序列到序列模型中固定长度上下文向量的局限性,如今已成为Transformer等现代架构的基础构建模块。