Translations:Softmax Function/14/zh

    From Marovi AI
    • $ T \to 0 $:分布坍缩为选择 argmax 的 one-hot 向量——等价于硬决策。
    • $ T = 1 $:标准 softmax。
    • $ T \to \infty $:分布趋近均匀——所有类别概率相等。