Translations:Word Embeddings/23/zh

    From Marovi AI

    其中 $ \mathbf{v}_w $$ \mathbf{v}'_w $ 分别是输入和输出嵌入向量。在整个词汇表上计算完整的 softmax 代价高昂,因此通常采用两种近似方法: