Jump to content
Toggle sidebar
Marovi AI
Search
English
Personal tools
Create account
Log in
Navigation
Main page
Recent changes
Random page
Help about MediaWiki
Tools
What links here
Related changes
Special pages
Printable version
Permanent link
Page information
In other languages
Add languages
Translations
:
Gradient Descent/33/zh
Translation unit
Discussion
不转换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
Read
View source
View history
More
Read
View source
View history
From Marovi AI
特征缩放
— 对输入特征进行归一化,使其具有相似的
取值范围
,可显著改善
收敛
,因为
损失曲面
变得更各向同性。
梯度裁剪
— 限制梯度的范数可以防止过大的更新。
随机初始化
— 从合理的随机初始化开始(例如,神经网络的 Xavier 或
He 初始化
)可以避免对称性破缺问题。
监控损失曲线
— 绘制训练损失随
迭代
的变化是最简单的诊断方法:平滑下降的曲线表示训练健康;振荡则表明
学习率
过高。