Jump to content
Toggle sidebar
Marovi AI
Search
English
Personal tools
Create account
Log in
Navigation
Main page
Recent changes
Random page
Help about MediaWiki
Tools
What links here
Related changes
Special pages
Printable version
Permanent link
Page information
In other languages
Add languages
Translations
:
Attention Mechanisms/33/zh
Translation unit
Discussion
臺灣正體
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
Read
View source
View history
More
Read
View source
View history
From Marovi AI
掩碼
:在自回歸解碼中,未來位置會被掩碼(在
softmax
之前設置為
$ -\infty $
),以保持因果結構。
注意力
dropout
:訓練期間隨機丟棄注意力權重起到
正則化
的作用,並減少對特定對齊模式的
過擬合
。
鍵-值緩存
:在推理過程中,先前計算的鍵和值
向量
會被緩存,以避免冗餘計算,從而顯著加快自回歸生成的速度。