donde $ \nabla f(\theta_t) $ es el vector de gradiente evaluado en el punto actual $ \theta_t $ y $ \eta > 0 $ es la tasa de aprendizaje.