Translations:Neural Networks/18/zh
| 函数 | 公式 | 范围 | 备注 |
|---|---|---|---|
| sigmoid | $ \sigma(z) = \frac{1}{1+e^{-z}} $ | (0, 1) | 历史上流行;存在梯度消失问题 |
| tanh | $ \tanh(z) = \frac{e^z - e^{-z}}{e^z + e^{-z}} $ | (−1, 1) | 以零为中心;对于较大输入仍会饱和 |
| ReLU | $ \max(0, z) $ | [0, ∞) | 现代网络的默认选择;可能导致"神经元死亡" |
| leaky ReLU | $ \max(\alpha z, z) $,其中 $ \alpha > 0 $ 较小 | (−∞, ∞) | 解决神经元死亡问题 |
| softmax | $ \frac{e^{z_i}}{\sum_j e^{z_j}} $ | (0, 1) | 用于多分类输出层 |