Translations:Gradient Descent/17/es
El descenso de gradiente por lotes completos calcula el gradiente exacto y, por lo tanto, sigue una trayectoria suave hacia el mínimo. El descenso de gradiente estocástico utiliza una sola muestra para estimar el gradiente, reduciendo drásticamente el cómputo por paso a costa de una trayectoria más ruidosa. El descenso de gradiente por mini-lotes logra un equilibrio y es la opción más común en la práctica, con tamaños de lote típicos entre 32 y 512.