Jump to content
Toggle sidebar
Marovi AI
Search
English
Personal tools
Create account
Log in
Navigation
Main page
Recent changes
Random page
Help about MediaWiki
Tools
What links here
Related changes
Special pages
Printable version
Permanent link
Page information
In other languages
Add languages
Translations
:
Gradient Descent/27/zh
Translation unit
Discussion
香港繁體
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
Read
View source
View history
More
Read
View source
View history
From Marovi AI
過大
— 迭代會振盪或發散。
過小
—
收斂
速度慢得難以接受。
學習率
調度
— 許多從業者從較大的學習率開始,並隨時間降低(
階梯衰減
、
指數衰減
、
餘弦退火
)。
線搜索
— 經典數值方法在每
步
選擇
$ \eta $
以滿足 Wolfe 或 Armijo 等條件,但在
深度學習
中很少使用。