Translations:Diffusion Models Are Real-Time Game Engines/74/zh

总体而言，我们观察到在随机轨迹上训练模型的效果出奇地好，但受到随机策略探索能力的限制。在比较单帧生成时，代理的效果稍好，PSNR 为 25.06，而随机策略为 24.42。在比较 3 秒自回归生成后的帧时，差距增大到 19.02 对 16.84。在手动操作模型时，我们发现某些区域对两者都很容易，而某些区域对两者都很困难，而在某些区域，代理的表现要好得多。基于此，我们根据它们与游戏起始位置的距离手动将 456 个例子分为三组：易、中等和难。我们观察到，在简单和困难集上，代理的表现仅略优于随机，而在中等集上，正如预期的那样，代理的表现要好得多（见表 2）。请参见附录 A.5 中的图 13，了解人类单次游戏的得分情况。