Jump to content
Toggle sidebar
Marovi AI
Search
English
Personal tools
Create account
Log in
Navigation
Main page
Recent changes
Random page
Help about MediaWiki
Tools
What links here
Related changes
Special pages
Printable version
Permanent link
Page information
In other languages
Add languages
Translations
:
Gradient Descent/33/zh
Translation unit
Discussion
香港繁體
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
Read
View source
View history
More
Read
View source
View history
From Marovi AI
特徵縮放
— 對輸入特徵進行歸一化,使其具有相似的
取值範圍
,可顯著改善
收斂
,因為
損失曲面
變得更各向同性。
梯度裁剪
— 限制梯度的範數可以防止過大的更新。
隨機初始化
— 從合理的隨機初始化開始(例如,神經網絡的 Xavier 或
He 初始化
)可以避免對稱性破缺問題。
監控損失曲線
— 繪製訓練損失隨
迭代
的變化是最簡單的診斷方法:平滑下降的曲線表示訓練健康;振盪則表明
學習率
過高。