我们使用DDIM采样(Song等人,2022)。我们仅对过去观测条件 o < n {\displaystyle o_{<n}} 采用了无分类器指导(Ho & Salimans,2022)。我们发现对过去动作条件 a < n {\displaystyle a_{<n}} 的指导无法提高质量。我们使用的权重相对较小(1.5),因为较大的权重会产生伪影,而我们的自动回归采样则会放大这些伪影。