Translations:Neural Networks/18/zh
| 函数 | 公式 | 取值范围 | 备注 |
|---|---|---|---|
| Sigmoid | $ \sigma(z) = \frac{1}{1+e^{-z}} $ | (0, 1) | 历史上较为流行;存在梯度消失问题 |
| Tanh | $ \tanh(z) = \frac{e^z - e^{-z}}{e^z + e^{-z}} $ | (−1, 1) | 以零为中心;对较大输入仍会饱和 |
| ReLU | $ \max(0, z) $ | [0, ∞) | 现代网络的默认选择;可能造成“死神经元” |
| Leaky ReLU | $ \max(\alpha z, z) $(其中 $ \alpha > 0 $ 较小) | (−∞, ∞) | 解决了死神经元问题 |
| softmax | $ \frac{e^{z_i}}{\sum_j e^{z_j}} $ | (0, 1) | 用于多类别分类的输出层 |