Translations:Diffusion Models Are Real-Time Game Engines/24/zh

    From Marovi AI
    Revision as of 00:20, 9 September 2024 by Felipefelixarias (talk | contribs) (Created page with "我们的最终目标是让人类玩家与我们的仿真进行互动。为此,第[https://arxiv.org/html/2408.14837v1#S2 2]节中的策略<math>\pi</math>即为“人类游戏策略”。由于我们无法直接大规模地从中取样,因此我们首先通过教一个自动代理来玩游戏,以此来近似人类游戏。与典型的强化学习设置不同,该设置旨在最大化游戏得分,我们的目标是生成与人类游戏类似的训练数据,或...")
    (diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

    我們的最終目標是讓人類玩家與我們的仿真進行互動。為此,第2節中的策略即為「人類遊戲策略」。由於我們無法直接大規模地從中取樣,因此我們首先通過教一個自動代理來玩遊戲,以此來近似人類遊戲。與典型的強化學習設置不同,該設置旨在最大化遊戲得分,我們的目標是生成與人類遊戲類似的訓練數據,或者至少在各種場景下包含足夠多的多樣化示例,以最大化訓練數據的效率。為此,我們設計了一個簡單的獎勵函數,這是我們的方法中唯一與環境相關的部分(見附錄A.3)。