Translations:Neural Networks/18/zh

    From Marovi AI
    函数 公式 取值范围 备注
    Sigmoid $ \sigma(z) = \frac{1}{1+e^{-z}} $ (0, 1) 历史上较为流行;存在梯度消失问题
    Tanh $ \tanh(z) = \frac{e^z - e^{-z}}{e^z + e^{-z}} $ (−1, 1) 以零为中心;对较大输入仍会饱和
    ReLU $ \max(0, z) $ [0, ∞) 现代网络的默认选择;可能造成“死神经元”
    Leaky ReLU $ \max(\alpha z, z) $(其中 $ \alpha > 0 $ 较小) (−∞, ∞) 解决了死神经元问题
    softmax $ \frac{e^{z_i}}{\sum_j e^{z_j}} $ (0, 1) 用于多类别分类的输出层