Translations:Convolutional Neural Networks/31/es

Usar modelos preentrenados (aprendizaje por transferencia) cuando los datos etiquetados sean limitados.
Preferir núcleos pequeños ( $3 \times 3$ ) apilados en profundidad — dos capas $3 \times 3$ tienen el mismo campo receptivo que una capa $5 \times 5$ pero con menos parámetros.
Aplicar normalización por lotes después de la convolución y antes de la activación.
Usar aumento de datos de forma generosa para reducir el sobreajuste.
Sustituir las capas totalmente conectadas por pooling promedio global para reducir parámetros.