Jump to content
Toggle sidebar
Marovi AI
Search
English
Personal tools
Create account
Log in
Navigation
Main page
Recent changes
Random page
Help about MediaWiki
Tools
What links here
Related changes
Special pages
Printable version
Permanent link
Page information
In other languages
Add languages
Translations
:
Gradient Descent/31/zh
Translation unit
Discussion
不转换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
Read
View source
View history
More
Read
View source
View history
From Marovi AI
动量
—— 从过去的梯度累积一个速度向量,有助于在峡谷状地形中加速
收敛
。
Nesterov 加速梯度
—— 一种在前瞻位置评估梯度的
动量
变体,能获得更好的理论
收敛
速率。
自适应方法
(
adagrad
、RMSProp、
adam
)—— 维护每个参数的
学习率
,根据梯度的历史进行自适应。
二阶方法
—— 牛顿法和 L-BFGS 等算法利用曲率信息(Hessian 矩阵或其近似)实现更快的
收敛
,但对于大规模问题通常过于昂贵。