Translations:Softmax Function/34/zh

    From Marovi AI
    • 注意力機制:Softmax 在 Transformer 架構中將對齊分數歸一化為 注意力權重。
    • 強化學習:對動作值估計進行 softmax 會產生隨機策略(玻爾茲曼探索)。
    • 混合模型:Softmax 在 混合專家架構中參數化混合係數。