Jump to content
Toggle sidebar
Marovi AI
Search
English
Personal tools
Create account
Log in
Navigation
Main page
Recent changes
Random page
Help about MediaWiki
Tools
What links here
Related changes
Special pages
Printable version
Permanent link
Page information
In other languages
Add languages
Translations
:
Attention Mechanisms/33/zh
Translation unit
Discussion
新加坡简体
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
Read
View source
View history
More
Read
View source
View history
From Marovi AI
掩码
:在自回归解码中,未来位置会被掩码(在
softmax
之前设置为
$ -\infty $
),以保持因果结构。
注意力
dropout
:训练期间随机丢弃注意力权重起到
正则化
的作用,并减少对特定对齐模式的
过拟合
。
键-值缓存
:在推理过程中,先前计算的键和值
向量
会被缓存,以避免冗余计算,从而显著加快自回归生成的速度。