Translations:Stochastic Gradient Descent/3/es

    From Marovi AI
    Revision as of 03:38, 27 April 2026 by DeployBot (talk | contribs) (Batch translate Stochastic Gradient Descent unit 3 → es)
    (diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

    En el descenso de gradiente clásico, el gradiente completo de la función de pérdida se calcula sobre todo el conjunto de entrenamiento antes de cada actualización de parámetros. Cuando el conjunto de datos es grande, esto se vuelve prohibitivamente costoso. SGD aborda el problema estimando el gradiente a partir de una única muestra elegida al azar (o un pequeño mini-batch) en cada paso, intercambiando una estimación más ruidosa por un costo por iteración drásticamente menor.