Jump to content
Toggle sidebar
Marovi AI
Search
English
Personal tools
Create account
Log in
Navigation
Main page
Recent changes
Random page
Help about MediaWiki
Tools
What links here
Related changes
Special pages
Printable version
Permanent link
Page information
In other languages
Add languages
Translations
:
Gradient Descent/27/zh
Translation unit
Discussion
不转换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
Read
View source
View history
More
Read
View source
View history
From Marovi AI
过大
—— 迭代会振荡或发散。
过小
——
收敛
速度慢得无法接受。
学习率
调度
—— 许多实践者先使用较大的学习率,再随时间减小(阶梯衰减、指数衰减、余弦退火)。
线搜索
—— 经典数值方法在每一步选择
$ \eta $
以满足 Wolfe 或 Armijo 等条件,尽管这在
深度学习
中很少见。