Translations:Softmax Function/34/zh

    From Marovi AI
    • 注意力机制:Softmax 在 Transformer 架构中将对齐分数归一化为 注意力权重。
    • 强化学习:对动作值估计进行 softmax 会产生随机策略(玻尔兹曼探索)。
    • 混合模型:Softmax 在 混合专家架构中参数化混合系数。