Translations:Softmax Function/19/es
Esto es matemáticamente equivalente (la constante se cancela) pero garantiza que el mayor exponente sea $ e^0 = 1 $, evitando el desbordamiento. Todos los principales marcos de aprendizaje profundo implementan automáticamente esta versión estabilizada.