Translations:Diffusion Models Are Real-Time Game Engines/43/es
El uso de solo 4 pasos de denoising resulta en un costo total de U-Net de 40 ms (y un costo total de inferencia de 50 ms, incluyendo el auto-codificador) o 20 fotogramas por segundo. Nuestra hipótesis es que el impacto insignificante en la calidad con pocos pasos en nuestro caso se debe a una combinación de: (1) un espacio de imágenes restringido, y (2) un fuerte condicionamiento por los fotogramas anteriores.